Modern megkzeltsben
Msodik, tdolgozott, bvtett kiads
Russell, Stuart
Norvig, Peter
Tartalom
Elsz .......................................................................................................................................... xxxiv
1. Bevezets ........................................................................................................................................ 1
1. Mi az MI? .............................................................................................................................. 1
1.1. Emberi mdon cselekedni: Turing-teszt megkzelts ............................................. 2
1.2. Emberi mdon gondolkodni: a kognitv modellezs ................................................ 3
1.3. Racionlisan gondolkodni: a gondolkods trvnye ................................................ 3
1.4. Racionlisan cselekedni: a racionlis gens ............................................................. 4
2. A mestersges intelligencia alapjai ....................................................................................... 5
2.1. Filozfia (i. e. 428-tl napjainkig) ............................................................................ 5
2.2. Matematika (kb. 800-tl napjainkig) ........................................................................ 6
2.3. Gazdasgtan (1776-tl napjainkig) ........................................................................... 8
2.4. Neurlis tudomnyok (1861-tl napjainkig) ............................................................. 8
2.5. Pszicholgia (1879-tl napjainkig) ......................................................................... 10
2.6. Szmtgpes tudomnyok (1940-tl napjainkig) .................................................. 11
2.7. Irnytselmlet s kibernetika (1948-tl napjainkig) ............................................ 12
2.8. Nyelvszet (1957-tl napjainkig) ............................................................................ 13
3. A mestersges intelligencia trtnete .................................................................................. 13
3.1. A mestersges intelligencia rleldse (19431955) .............................................. 13
3.2. A mestersges intelligencia megszletse (1956) ................................................... 14
3.3. Korai lelkeseds, nagy elvrsok (19521969) ...................................................... 15
3.4. Egy adag realits (19661973) ............................................................................... 17
3.5. Tudsalap rendszerek: a hatalom kulcsa? (19691979) ....................................... 18
3.6. Az MI iparr vlik (1980-tl napjainkig) ................................................................ 20
3.7. A neurlis hlk visszatrse (1986-tl napjainkig) ............................................... 20
3.8. Az MI tudomnny vlik (1987-tl napjainkig) ..................................................... 21
3.9. Az intelligens gensek kialakulsa (1995-tl napjainkig) ...................................... 22
4. A mestersges intelligencia jelenlegi helyzete .................................................................... 22
5. sszefoglals ...................................................................................................................... 23
5.1. Irodalmi s trtneti megjegyzsek ........................................................................ 24
5.2. Feladatok ................................................................................................................ 24
2. Intelligens gensek ....................................................................................................................... 27
1. Bevezets ............................................................................................................................ 27
2. J viselkeds: a racionalits koncepcija ............................................................................ 29
2.1. Teljestmnymrtkek ............................................................................................ 29
2.2. Racionalits ............................................................................................................ 30
2.3. Mindentuds, tanuls s autonmia ........................................................................ 31
3. A Krnyezetek termszete .................................................................................................. 32
3.1. A krnyezet meghatrozsa .................................................................................... 32
3.2. A krnyezetek tulajdonsgai ................................................................................... 34
4. Az intelligens gensek struktrja ....................................................................................... 36
4.1. gensprogramok .................................................................................................... 36
4.2. Egyszer reflexszer gensek ................................................................................. 38
4.3. Modellalap reflexszer gensek ............................................................................ 40
4.4. Clorientlt gensek ............................................................................................... 41
4.5. Hasznossgorientlt gensek .................................................................................. 42
4.6. Tanul gensek ....................................................................................................... 43
5. sszefoglals ...................................................................................................................... 46
5.1. Irodalmi s trtneti megjegyzsek ........................................................................ 46
5.2. Feladatok ................................................................................................................ 48
3. Problmamegolds keresssel ...................................................................................................... 50
1. Problmamegold gensek .................................................................................................. 50
1.1. Jl definilt problmk s megoldsok ................................................................... 52
1.2. A problmk megfogalmazsa ............................................................................... 53
2. Pldaproblmk ................................................................................................................... 54
2.1. Jtkproblmk ....................................................................................................... 54
2.2. Valsvilg-beli problmk ...................................................................................... 57
iii
Created by XMLmind XSL-FO Converter.
Mestersges Intelligencia
Mestersges Intelligencia
147
148
152
153
154
157
160
160
161
162
162
163
164
164
164
164
164
166
166
169
175
176
177
180
183
185
186
187
188
189
191
193
193
195
195
199
199
200
201
203
203
204
205
208
209
209
212
216
216
219
219
221
222
222
223
223
223
224
225
226
Mestersges Intelligencia
226
227
227
228
229
231
233
233
235
235
235
236
237
237
238
238
238
239
240
244
244
244
245
246
247
248
249
251
251
252
254
254
255
257
257
257
259
260
261
263
264
264
266
266
268
271
272
272
273
273
273
273
274
275
276
276
277
278
281
286
Mestersges Intelligencia
1. Ontolgiaszervezs ...........................................................................................................
2. Kategrik s objektumok .................................................................................................
2.1. Fizikai sszettel ...................................................................................................
2.2. Mrtkek ...............................................................................................................
2.3. Szubsztancik s objektumok ...............................................................................
3. Cselekvsek, szitucik s esemnyek ..............................................................................
3.1. A szitucikalkulus ontolgija ............................................................................
3.2. Cselekvsek lersa a szitucikalkulusban ..........................................................
3.3. A reprezentcis problma megoldsa .................................................................
3.4. A kvetkeztetsi keretproblma megoldsa ..........................................................
3.5. Id- s esemnykalkulus .......................................................................................
3.6. ltalnostott esemnyek ......................................................................................
3.7. Folyamatok ...........................................................................................................
3.8. Intervallumok .......................................................................................................
3.9. Foly esemnyek s objektumok ..........................................................................
4. Mentlis esemnyek s mentlis objektumok ...................................................................
4.1. A hiedelmek formlis elmlete .............................................................................
4.2. Tuds s hiedelem ................................................................................................
4.3. Tuds, id s cselekvs .........................................................................................
5. Az internetes bevsrls vilga .........................................................................................
5.1. Ajnlatok sszehasonltsa ...................................................................................
6. Kvetkeztet rendszerek kategrik szmra ...................................................................
6.1. Szemantikus hlk ................................................................................................
6.2. Ler logikk ........................................................................................................
7. Kvetkeztets alaprtelmezett informcival ....................................................................
7.1. Nyitott s zrt vilgok ...........................................................................................
7.2. Negls mint kudarc s stabil modell szemantika ................................................
7.3. Krlrs s alapeseti logika .................................................................................
8. Igazsg-karbantart rendszerek .........................................................................................
9. sszefoglals ....................................................................................................................
9.1. Irodalmi s trtneti megjegyzsek ......................................................................
9.2. Feladatok ..............................................................................................................
11. Tervkszts ..............................................................................................................................
1. A tervksztsi problma ...................................................................................................
1.1. A tervksztsi problmk nyelve .........................................................................
1.2. Kifejezkpessg s kiterjesztsek .......................................................................
1.3. Plda: Lgi teherszllts ......................................................................................
1.4. Plda: A ptkerk problma .................................................................................
1.5. Plda: A kockavilg ..............................................................................................
2. Tervkszts llapottr-keresssel .....................................................................................
2.1. Elrefel keress az llapottrben .........................................................................
2.2. Htrafel keress az llapottrben ........................................................................
2.3. llapottr-keressi heurisztikk ...........................................................................
3. Rszben rendezett tervkszts ..........................................................................................
3.1. Plda a rszben rendezett tervksztsre ...............................................................
3.2. Rszben rendezett tervkszts ktetlen vltozkkal ............................................
3.3. Heurisztikk a rszben rendezett tervksztsre ....................................................
4. Tervksztsi grfok ..........................................................................................................
4.1. Tervksztsi grfok heurisztikus becslsekre ......................................................
4.2. A Graphplan algoritmus .......................................................................................
4.3. A Graphplan algoritmus lellsa ..........................................................................
5. Tervkszts tletlogikval ...............................................................................................
5.1. Tervksztsi problmk tletlogikai lersa ........................................................
5.2. Az tletlogikai lers bonyolultsga .....................................................................
6. A tervksztsi mdszerek elemzse .................................................................................
7. sszefoglals ....................................................................................................................
7.1. Irodalmi s trtneti megjegyzsek ......................................................................
7.2. Feladatok ..............................................................................................................
12. Tervkszts s cselekvs a val vilgban ................................................................................
1. Id, temezs s erforrsok .............................................................................................
vii
Created by XMLmind XSL-FO Converter.
286
288
289
290
292
293
293
295
296
297
298
299
301
302
303
304
304
306
306
307
310
311
311
314
316
316
318
319
321
322
323
328
334
334
335
336
338
338
339
340
340
341
342
344
347
349
350
350
352
353
355
356
356
358
360
361
361
363
369
369
Mestersges Intelligencia
371
373
374
376
378
380
382
382
386
389
393
396
397
398
399
400
400
401
404
408
408
408
410
411
411
412
412
413
414
415
416
417
418
421
422
422
423
425
428
429
430
434
434
436
436
440
440
441
444
444
447
449
449
450
450
455
457
460
461
463
Mestersges Intelligencia
464
465
465
469
473
473
473
474
476
477
479
481
482
483
485
486
487
489
490
491
492
495
496
499
500
502
504
506
507
508
510
513
513
514
514
516
517
517
519
520
521
522
524
524
525
526
527
527
529
529
530
532
533
534
538
538
538
541
542
543
Mestersges Intelligencia
544
545
548
550
553
555
563
565
566
567
571
571
572
574
574
575
576
579
580
582
583
584
588
588
590
592
593
593
595
598
598
598
599
601
605
606
607
608
609
610
612
612
613
615
615
618
620
622
623
623
625
627
627
630
630
632
633
635
637
638
Mestersges Intelligencia
639
641
644
645
645
646
646
648
649
650
651
652
656
660
660
664
665
666
669
673
673
674
675
676
677
679
680
683
684
687
687
688
691
692
694
697
697
698
699
702
702
703
704
706
711
713
715
716
717
718
719
721
722
723
724
725
725
727
728
730
Mestersges Intelligencia
731
734
737
737
739
741
742
742
745
745
746
747
748
751
752
753
756
757
757
759
762
762
763
763
764
765
766
766
767
770
770
771
774
775
776
777
780
782
783
785
787
789
789
791
795
795
796
796
797
799
800
805
808
808
808
811
813
814
815
817
Mestersges Intelligencia
xiii
Created by XMLmind XSL-FO Converter.
818
819
820
821
822
823
823
824
826
827
829
834
834
835
836
837
838
840
840
841
842
844
847
847
849
851
851
853
854
856
857
857
857
858
858
860
861
863
863
863
864
865
942
942
Az brk listja
1.1. Az MI nhny meghatrozsa ngy kategriba szervezve ......................................................... 1
1.2. Az idegsejt vagy neuron rszei. Minden neuron sejttestbl vagy szmbl ll, amely sejtmagot
tartalmaz. A sejttestbl gazik el nhny dendritnek nevezett s egy hossz, axonnak nevezett szl. Az
axon j messzire elr, sokkal messzebbre, mint ahogy ezt a jelen bra sugallja. Az axonok tipikusan 1 cm
hosszak (ez a sejttest tmrjnek 100-szorosa), de elrhetik az 1 m-t is. Egy neuron 10100 000 ms
neuronnal tart kapcsolatot a szinapszisoknak nevezett csatlakozsokon keresztl. A jeleket neuronrl
neuronra egy sszetett elektrokmiai reakci tovbbtja. A jelek rvid tvon szablyozzk az agy
aktivitst, hossz tvon pedig befolysoljk a neuronok helyzett s a kapcsoldsi rendszerket. gy
tartjk, e mechanizmusok kpezik az agyi tanuls alapjt. Az informcifeldolgozs zme az agykregben
trtnik, ami az agy kls rtege. A feldolgozs szervezeti egysge, gy tnik, egy kb. 0,5 mm-es
tmrj szvetoszlop, amelynek magassga az egsz kregre kiterjed, ez az embereknl kb. 4 mm. Egy
oszlop kb. 20 000 neuront tartalmaz. .................................................................................................. 9
1.3. A szmtgpek szmtsi erforrsainak (2003 krl) s az agy erforrsainak durva
sszehasonltsa. A knyv els kiadsa ta a szmtgpekre jellemz szmok legalbb egy 10-es
szorzval megnttek, s vrhat, hogy ez a nvekeds ebben az vtizedben is folytatdik. Az agyra
jellemz szmok az utbbi 10 000 vben nem vltoztak. ................................................................. 10
1.4. Egy konkrt problma, amelyet Evans ANALOGY programja megoldott ..................................... 16
1.5. Egy elrendezs a kockavilgban. A SHRDLU robot (Winograd, 1972) ppen sikeresen teljestette a
keresd meg azt a blokkot, ami a kezedben tartottnl magasabb, s tedd a dobozba utastst. ....... 16
2.1. Az gensek krnyezetkkel rzkelkn s beavatkozkon keresztl llnak kapcsolatban ...... 27
2.2. A porszvvilg mindssze kt helysznnel ............................................................................... 28
2.3. A 2.2. brn szerepl porszvvilg egy egyszer gensfggvnye rszleges tblzatos formban
28
2.4. Egy automatizlt taxi feladatkrnyezetnek TKB-lersa ....................................................... 32
2.5. Pldk genstpusokra s TKB-lersuk .................................................................................. 33
2.6. Pldk feladatkrnyezetekre s jellemzik ................................................................................ 35
2.7. A TBLZAT-VEZRLS-GENS program minden egyes j szlelsre meghvdik, s minden
alkalommal visszaad egy cselekvst. Sajt adatstruktrjban kveti nyomon az szlelsi sorozatot. 37
2.8. Egy egyszer reflexszer gens programja a ktllapot porszvkrnyezetben. A 2.3. brn megadott
gensfggvnyt valstja meg. .......................................................................................................... 38
2.9. Egy egyszer reflexszer gens sematikus diagramja ............................................................... 38
2.10. Egy egyszer reflexszer gens. A jelenlegi szitucira (amit az szlels hatroz meg) illeszked
felttel szably megkeressvel, majd a hozz tartoz cselekvs vgrehajtsval mkdik. ......... 39
2.11. Bels llapottal rendelkez reflexszer gens ......................................................................... 40
2.12. A modellalap reflexszer gens. Nyomon kveti a vilg jelenlegi llapott egy bels modellben.
Ezek utn a reflexszer genshez hasonlan vlaszt egy cselekvst. ............................................... 40
2.13. Egy modellalap, clorientlt gens. Nyomon kveti a vilg llapott s az elrend clok halmazt
is, s kivlaszt egy cselekvst, amely (vgs soron) cljainak elrshez vezet. ............................. 41
2.14. Egy modellalap, hasznossgalap gens. A vilg modellje mellett egy hasznossgfggvnyt is
alkalmaz, amely a vilg llapotaihoz rendelt preferenciit mri. Ezek utn olyan cselekvst vlaszt, amely
a legjobb vrhat hasznossghoz vezet, amit az sszes lehetsges vgllapot elfordulsi valsznsgvel
slyozott tlagolsval szmt ki. ..................................................................................................... 43
2.15. Tanul gensek egy ltalnos modellje ................................................................................... 44
3.1. Egy egyszer problmamegold gens. Elszr a clt s a problmt fogalmazza meg, majd a
problmt megold cselekvssorozatot keres, vgl a cselekvseket egyenknt vgrehajtja. Amikor ksz
vele, egy msik clt fogalmaz meg, s az egszet jrakezdi. Jegyezzk meg, hogy a cselekvssorozata
vgrehajtsa alatt az gens az rzkelseivel nem foglalkozik. Felttelezi, hogy az ltala megtallt
megolds mindig mkdkpes. ...................................................................................................... 51
3.2. Romnia egy rsznek sematikus orszgti trkpe .................................................................. 53
3.3. A porszvvilg llapottere. Az lek cselekvseket jelentenek: B = Balra, J = Jobbra, S = Szv. 54
3.4. A 8-as kirakjtk egy tipikus feladvnya ................................................................................. 55
3.5. Egy majdnem j megolds a 8-kirlyn problmra. (A megolds megkeresst az olvasra bzzuk.)
56
3.6. Az Arad s Bukarest kztti tkeressi problma rszleges keressi fi. A kifejtett csompontokat
rnykoltuk, a legenerlt, de mg ki nem fejtett csompontok vastagon keretezettek, a mg le nem
generlt csompontokat pedig halvny szaggatott vonalak jelzik. ................................................... 59
xiv
Created by XMLmind XSL-FO Converter.
Mestersges Intelligencia
Mestersges Intelligencia
Mestersges Intelligencia
Mestersges Intelligencia
kvetkeztethetjk ki, hogy a gykr rtke legalbb 3, mert MAX-nak a gykrben 3-as rtk vlasztsa
van. (d) A C alatti els levlnek 2 az rtke. C teht, ami egy MIN csompont, legfeljebb 2 rtk. De mi
tudjuk mr, hogy B-nek 3 az rtke, MAX teht C-t soha nem fogja vlasztani. Azrt nem is rdemes C
tovbbi kvetit megvizsglni. Ez az alfa-bta nyess egy pldja. (e) A D alatti els levlnek 14 az
rtke, gy D rtke legfeljebb 14. Ez tbb mint MAX legjobb alternatvja (azaz 3), meg kell vizsglni ezrt
D kvetit. Jegyezzk meg, hogy most a gykr minden kvetje esetn rendelkeznk rtkkorlttal, a
gykr rtke legfeljebb 14. (f) D msodik kvetjnek rtke 5, gy tovbb kell folytatnunk a vizsglatot.
A harmadik kvet rtke 2, D rtke teht pontosan 2. MAX dntse a gykrnl, hogy B fel kell lpni, 3as rtkkel. ...................................................................................................................................... 149
6.6. Alfa-bta nyess: ltalnos eset. Ha m a Jtkos szmra jobb, mint n, akkor a jtk sorn sosem
fogunk elrni n-be. .......................................................................................................................... 150
6.7. Az alfa-bta keressi algoritmus. Ugyanazt a szmtst hajtja vgre, mint egy norml minimax
algoritmus a 6.3. brn, kivve kt sort a MAX-RTK s a MIN-RTK hvsokban, ahol az s a
rtkeket kezeli (s adminisztrlja e paramterek tadst). .......................................................... 152
6.8. Kt, kiss eltr sakktblalls. (a) Feketnek egy huszr s kt gyalog elnye van, s a jtkot
megnyeri. (b) Fekete veszt, miutn Fehr a vezrt leti. ............................................................. 154
6.9. A horizonthats. A fekete bstyval adott sorozatos sakk a horizonton tlra knyszerti az
elkerlhetetlen vezrr vltoztat lpst, s ezt a tblallst enyhn elnys llsknt tnteti fel Fekete
szmra, holott Fehr szmra ez egy biztos nyer lls. ............................................................... 155
6.10. Egy tipikus ostblalls. A jtk lnyege, hogy az egyik fl sszes bbujt eltvoltsuk a tblrl.
Fehr az ramutat jrsval egyez irnyban halad a 25-s fel, mg Fekete az ramutat jrsval
ellenttes irnyban, a 0 fel halad. Egy bbuval brmelyik helyre lehet lpni, kivve azokat a helyeket,
ahol az ellenflnek mr legalbb kt bbuja tallhat. Ha egy olyan helyre lpnk, ahol az ellenflnek egy
bbuja tallhat, akkor azt a bbut elfogtuk, s a lpkedst az elejrl kell jrakezdenie. Ennl a
tblallsnl Fehr pp most dobott 65-t, s ngy megengedett lps kzl vlaszthat: (510,511), (5
11,1924), (510,1016) s (511,1116). .................................................................................... 157
6.11. Egy ostblalls sematikus jtkfja ...................................................................................... 158
6.12. A levlrtkeken vgrehajtott sorrendrz transzformci megvltoztatja a legjobb lpst . 160
6.13. Egy olyan egylpsvltsos jtkfa, amire a minimax alkalmatlannak tnik ........................ 165
6.14. Egy egyszer jtk kiindul llsa. Az A jtkos indul elsnek. Mindkt jtkos felvltva lp s a
zsetonjt a szomszdos szabad helyre helyezheti, mindkt irnyban. Ha a szomszdos mez foglalt, akkor
a jtkos az ellenfl felett tugorhat a kvetkez szabad helyre, ha van ilyen. (Pldul ha A a 3-n s B a 2n van, akkor A visszalphet 1-re.) A jtknak vge, ha az egyik jtkos elri a tbla ellenttes vgt. Ha az
A jtkos elsnek ri el a 4-et, a jtk rtke +1, ha B jtkos ri el elsnek az 1-et, a jtk rtke az A
szmra 1. ..................................................................................................................................... 170
6.15. Az a helyzet, amikor az algoritmus eldnti, hogy lenyesheti-e az nj csompontot ................ 171
7.1. Egy ltalnos tudsbzis gens .............................................................................................. 176
7.2. Egy tipikus wumpus vilg. Az gens a bal als sarokban van. ................................................ 177
7.3. Az gens els lpse a wumpus vilgban. (a) A kezdeti helyzet a [Nincs, Nincs, Nincs, Nincs, Nincs]
rzkelse utn. (b) Az els lps utn, rzkelve a [Nincs, Szell, Nincs, Nincs, Nincs]-et. ......... 179
7.4. Kt ksbbi helyzet az gens elrehaladsa sorn. (a) A harmadik lpst kveten, miutn [Bz,
Nincs, Nincs, Nincs, Nincs]-et rzkelt. (b) Az tdik lps s a [Bz, Szell, Csillogs, Nincs, Nincs]
rzkelse utn ................................................................................................................................ 180
7.5. Lehetsges modelljei a csapda jelenltnek az [1, 2], [2, 2] s [3, 1]-ben, ha adott a megfigyels, hogy
az [1, 1]-ben semmi s a [2, 1]-ben szell rezhet. (a) A tudsbzis s 1(nincs csapda[1, 2]-ben)
modelljei. (b) A tudsbzis s 2(nincs csapda[2, 2]-ben) modelljei. ............................................ 182
7.6. A mondatok az gens fizikai konfigurcii, s a kvetkeztets az a folyamat, amely j fizikai
konfigurcikat hoz ltre rgiekbl. A logikai kvetkeztetsnek biztostania kell, hogy az j konfigurcik
olyan aspektusait reprezentljk a vilgnak, amelyek tnylegesen is kvetkeznek azokbl az
aspektusokbl, amelyeket a rgi konfigurcik reprezentlnak. .................................................... 183
7.7. tletkalkulus-beli mondatok BNF (BackusNaur-forma) nyelvtana ...................................... 184
7.8. Az t logikai sszektjel igazsgtblja. Amikor a tblt hasznljuk pldul a P Q rtknek
szmtsra, ha P igaz s Q hamis, akkor elszr megkeressk azt a sort, amelyben P igaz s Q hamis (a
harmadik sor). Ezutn a sorban megkeressk a P Q alatti oszlopot, hogy megtalljuk az eredmnyt:
igaz. Tekinthetjk a tblzat gy is, hogy minden sor egy modell, s az egyes oszlopbeli elemek az adott
sorban azt mondjk meg, hogy a megfelel mondat igaz-e az adott modellben. ............................ 186
7.9. A tudsbzis alapjn ptett igazsgtbla lthat az brn. A TB igaz, ha Sz1-tl s Sz5-ig igaz, amely a
128 sorbl csak 3-ban fordul el. Mind a 3 sorban C1,2 hamis, teht nincsen csapda az [1, 2]-ben. Viszont
lehet, hogy van csapda [2, 2]-ben (br lehet, hogy nincs). ............................................................. 187
xviii
Created by XMLmind XSL-FO Converter.
Mestersges Intelligencia
xix
Created by XMLmind XSL-FO Converter.
Mestersges Intelligencia
Mestersges Intelligencia
10.12. Horn-klzok egy halmaznak Clark-lezrsa. Az eredeti Horn-program (balra) ngy tantrgyat
emlt explicit mdon, s azt is lltja, hogy minden egszre a 101 s a 130 kztt ltezik egy matematikai
trgy, meg azt is, hogy minden SZT trgyhoz a 100-as (BSc) sorozatban ltezik egy megfelel tantrgy a
200-as (MSc) sorozatban. A Clark-lezrs (jobbra) azt mondja, hogy ms tantrgy nincs is. A lezrssal s
az egyedi elnevezsek felttelezssel (valamint az Egsz prediktum nyilvnval defincijval) egytt
eljutunk a kvnt konklziig, miszerint pontosan 36 tantrgy van: 30 matematikai s 6 SZT trgy. 317
11.1. A Strips s az ADL nyelv sszehasonltsa a tervksztsi feladatok reprezentcijnak
szempontjbl. Mindkt esetben a clok gy viselkednek, mint egy paramterek nlkli cselekvs
elfelttelei. .................................................................................................................................... 337
11.2. A STRIPS-problma replterek kztti lgi teherszlltsi feladathoz ................................ 338
11.3. Az egyszer ptkerk problma ............................................................................................ 338
11.4. A kockavilg tervksztsi problmja: egy hrom kockbl ll torony ptse. A [Mozgat(B,
Asztal, C), Mozgat(A, Asztal, B)] cselekvssor egy lehetsges megolds. ...................................... 340
11.5. A tervkszts kt megkzeltse. (a) Elrefel (progresszv) llapottr-keress, a kiindul llapotbl
indulva s a problma cselekvseit hasznlva halad a cl fel. (b) Visszafel (regresszis) llapottrkeress: valsznsgi llapot keress (lsd 6.1. szakasz - Szenzor nlkli problmk rszben) a
clllapot(ok)bl indulva a cselekvsek inverzt alkalmazva keresi visszafel a kezdeti llapotot. 341
11.6. Egy rszben rendezett terv a zokni s a cip felvtelhez, s a hat lehetsges sorba rendezs a
teljesen rendezett tervhez ................................................................................................................ 344
11.7. Az egyszer kerkcsere problma ......................................................................................... 347
11.8. A nem teljes rszben rendezett terv a kerkcsere problmhoz, miutn megvlasztottuk a
cselekvseket az els kt nyitott elfelttelhez. A dobozok cselekvseket testestenek meg, a bal oldalon
az elfelttelekkel, a jobb oldalon pedig a kvetkezmnyekkel. (Az Indt cselekvst kivve a
kvetkezmnyeket elhagytuk.) A fekete nyilak az okozati kapcsolatokat mutatjk, melyek a nyl fejnl
szerepl lltst vdik. .................................................................................................................... 347
11.9. A terv alakulsa, az Otthagyjszakra vlasztsa utn, amit a Ott(LaposKerk, Tengely) elrshez
vlasztottunk. Hogy elkerljk az tkzst az Ott(Ptkerk, Csomagtart)-t vd, az Eltvolt(Ptkerk,
Csomagtart)-bl indul okozati kapcsolattal, az Otthagyjszakra cselekvst egy rendezsi megktssel
az Eltvolt(Ptkerk, Csomagtart) el helyeztk, amit a szaggatott nyllal jelltnk. ................ 348
11.10. A kerkcsere problma vgs megoldsa. Vegyk szre, hogy az Eltvolt(Ptkerk, Csomagtart)
s az Eltvolt(LaposKerk, Tengely) tetszleges sorrendben vgrehajthat a Felszerel(Ptkerk, Tengely)
eltt. ................................................................................................................................................ 349
11.11. A legyen sti s egynk is problma ................................................................................ 351
11.12. A legyen sti s egynk is problma tervksztsi grfja az S2 szintig. A tglalapok az akcikat
jelentik (a kicsi ngyzetek a megrz cselekvsek), az egyenesek az elfeltteleket s a kvetkezmnyeket
jellik. A klcsns kizrsokat velt szrke vonalak jellik. ........................................................ 351
11.13. A GRAPHPLAN algoritmus. A GRAPHPLAN algoritmus egy megolds kinyer s egy grf-bvt lps
kztt alternl. A MEGOLDS-KINYERS a befejezstl visszafel keresve ellenrzi, hogy tallhat-e
megolds. A GRF-BVTS adja a cselekvseket az adott szinthez s az llapotliterlokat a kvetkezhz.
......................................................................................................................................................... 353
11.14. A kerkcsere problma tervksztsi grfja az S2 szintre bvts utn. A mutex kapcsolatokat szrke
vonalak jellik. Csak nhny fontos mutexet mutatunk, mert az bra olvashatatlann vlna, ha az sszeset
jellnnk. A megoldst megvastagtott vonalak s kiemelsek jellik. .......................................... 354
11.15. A SATPLAN algoritmus. A tervksztsi feladatot egy konjunktv norml formj mondatra fordtjuk
le, amelyben minden cl egy megadott T idpillanatban teljesl, s T-ig minden lpsre tartalmazza az
aximkat. (A fordts rszleteit a szvegben rjuk le.) Ha a kielgthetsgi algoritmus tall modellt,
akkor a tervet a modellben az igaz rtket kapott tletlogikai szimblumokhoz tartoz cselekvsek
kinyersvel kapjuk meg. Ha nem ltezik modell, akkor a folyamatot ismteljk, a clt egy lpssel
ksbbre mozgatva. ........................................................................................................................ 356
11.16. A Sussman-anomlia kockavilg tervksztsi problma .................................................... 365
11.17. Shakey vilga. Shakey kpes egy szobn bell mozogni, t tud menni a szobk kztti ajtkon, fel
tud mszni trgyakra, el tudja tolni a mozdthat trgyakat, valamint a villanyt tudja kapcsolni. . 366
12.1. A kt aut sszeszerelst tartalmaz temezsi feladat. A jellsben az Idtartam(d) jelentse,
hogy egy cselekvs d percet vesz ignybe. A Motor(E1, C1, 60) jelentse az, hogy az E1 egy motor, ami a
C1 alvzba illeszthet s 60 perc alatt szerelhet be. ...................................................................... 369
12.2. A 12.1. brn szerepl temezsi problma megoldsa. Az bra tetejn a rszben rendezett terv
megoldsa lthat. Minden cselekvs hozza a tglalap aljn lthat, a legkorbbi s a legksbbi kezdsi
idkkel [ES, LS] a bal fels sarokban. A kt szm kztt klnbsg a cselekvs mozgstere, a 0
mozgster cselekvsek a kritikus tvonalon vannak, melyeket vastag vonallal jellnk. Az bra aljn
ugyanezen megolds idrendjt lthatjuk. A szrke tglalapok azt az intervallumot jellik, ami alatt a
xxi
Created by XMLmind XSL-FO Converter.
Mestersges Intelligencia
Mestersges Intelligencia
ami sikertelen volt, (c)-t az (a)-ra ejtette. jraprblja a Mozgat(C, D) cselekvst, amivel elri a (d)
clllapotot. .................................................................................................................................... 394
12.16. A folytonos tervkszt gens ltal ksztett kiindul terv. A terv egyelre nem klnbzik egy
tlagos rszben rendezett tervkszt ltal ksztettl. .................................................................... 394
12.17. Miutn valaki ms elmozdtotta a D kockt a B-re, a Tiszta(B) s a Rajta(D, G) biztostsra
szolgl kapcsolatokat eldobjuk, ami ezt a tervet eredmnyezi ..................................................... 394
12.18. A Mozgat(C, D) ltal ltrehozott kapcsolatot helyettestettk az Indt kapcsolatval, a most mr
redundns Mozgat(D, B) lpst pedig elhagytuk ............................................................................ 395
12.19. A Mozgat(C, D) vgrehajtsa s a tervbl val eltvoltsa utn az Indt lps kvetkezmnyei azt a
tnyt tkrzik, hogy a C a vrt D helyett az A kockra kerlt. A Rajta(C, D) cl elfelttel mg minding
nyitott. ............................................................................................................................................. 395
12.20. A nyitott elfelttelt a Mozgat(C, D) ismtelt hozzadsval oldjuk fel. Vegyk szre az
elfelttelekhez szksges j kapcsolatokat. .................................................................................. 395
12.21. A Mozgat(C, D) vgrehajtsa s tervbl eltvoltsa utn a Rajta(C, D) megmaradt nyitott felttelt
az Indt lpsbl indul okozati kapcsolat hozzadsval oldjuk fel. A terv most teljes. ............... 395
12.22. A FOLYTONOS-RRT-GENS, egy folytonos, rszben rendezett tervkszt gens. Egy rzkels utn
az gens eltvolt egy lpssorozatot a folytonosan javtott tervbl, s visszaad egy cselekvst. Gyakran
szmos cselekvssor-eltvolt tervksztsi lpsre van szksg, mialatt csak a NoOp-ot adja vissza,
mieltt kszen llna egy vals cselekvs vgrehajtsra. ............................................................... 396
12.23. A pros tenisz problma. Kt gens egytt jtszik, s ngy pozci egyikben lehetnek: [Bal,
Alapvonal], [Jobb, Alapvonal], [Bal, Hl] s [Jobb, Hl]. A labda visszaadhat, ha pontosan egy
jtkos van a megfelel helyen. ...................................................................................................... 397
13.1. Dntselmleti gens, amely racionlis cselekvseket vlaszt ki. A lpseket a kvetkez t
fejezetben rszletezzk. .................................................................................................................. 411
13.2. Mivel az 1. gens meggyzdse nem kvetkezetes, ezrt a 2. gens tud gy tteket tenni, amely a
s b kimeneteltl fggetlenl biztostja, hogy az 1. gens vesztsen ............................................ 418
13.3. A Fogfjs, Lyuk, Beakads vilg egy teljes egyttes valsznsg-eloszlsa ...................... 418
13.4. A valsznsgi kvetkeztets egy olyan algoritmusa, amely valamely teljes egyttes valsznsgi
eloszls bejegyzseit veszi szmba ................................................................................................. 420
13.5. Kt plda nagymret egyttes eloszlsok kisebb eloszlsokra val felbontsra az abszolt
fggetlensg alapjn. (a) Az idjrs s a fogszati problmk fggetlenek. (b) A pnzfeldobsok
fggetlenek. .................................................................................................................................... 421
13.6. (a) Az gens beragad, miutn [1, 2]-ben s [2, 1]-ben is szellt szlel nincs feltrhat biztonsgos
hely. (b) A ngyzetek sztosztsa Ismert, Perem s Egyb csoportokba az [1, 3]-ra vonatkoz
lekrdezshez. ................................................................................................................................. 426
13.7. C2,2 s C3,1 peremvltozk, az egyes modellek C(perem) rtkt mutat konzisztens modelljei: (a)
hrom, kt vagy hrom csapdt jelz modell C1,3 = igaz mellett, s (b) kt, egy vagy kt csapdt jelz
modell C1,3 = hamis mellett. ............................................................................................................ 427
14.1. Egy egyszer Bayes-hl, amelyben az Idjrs fggetlen a tbbi hrom vltoztl, a Fogfjs s a
Beakads pedig felttelesen fggetlenek a Lyuk ismeretben ........................................................ 435
14.2. Egy tipikus Bayes-hl, amely a topolgit s a feltteles valsznsgi tblkat (FVT) is mutatja.
Az FVT-kben B, F, R, J s M szerepel Betrs, Fldrengs, Riaszts, JnosTelefonl s MriaTelefonl
helyett. ............................................................................................................................................ 435
14.3. A hl struktrja fgg a hozzads sorrendjtl. A csompontokat mindegyik hlhoz fellrl
lefel haladva adtuk hozz. ............................................................................................................. 438
14.4. (a) Az X csompont felttelesen fggetlen a nem leszrmazottaitl (Zij-ktl) a szlei (a szrke
terleten lthat Ui-k) ismeretben. (b) Az X csompont felttelesen fggetlen a hl sszes tbbi
csompontjtl a Markov-takarjnak ismeretben (a szrke terlet). .......................................... 440
14.5. Egy egyszer hl diszkrt (Tmogats s Vsrol) s folytonos (Terms s r) vltozkkal 442
14.6. Az (a) s (b) grafikonok az r valsznsg-eloszlst mutatjk a Terms fggvnyben s a
Tmogats igaz s hamis rtke mellett. A (c) diagram a P(r Terms) eloszlst mutatja, ami a kt aleset
sszegzseknt addik. ................................................................................................................... 443
14.7. (a) A Vsrls valsznsgnek probit eloszlsa az r ismeretben, = 6,0 s = 1,0 mellett. (b)
Logit eloszls hasonl paramterekkel. .......................................................................................... 443
14.8. A (14.3) egyenletben szerepl kifejezs struktrja. A kirtkels fentrl lefel halad, sszeszorozva
az rtkeket az egyes tvonalak mentn, s sszegezve a + csompontoknl. Vegyk szre, a j-hez s az
m-hez tartoz tvonalak megismtldst. ..................................................................................... 445
14.9. A felsorol algoritmus Bayes-hls lekrdezsek megvlaszolsra .................................... 446
14.10. A vltoz eliminls algoritmus Bayes-hls lekrdezsek megvlaszolsra ................... 448
xxiii
Created by XMLmind XSL-FO Converter.
Mestersges Intelligencia
14.11. (a) Egy tbbszrsen sszekttt hl feltteles valsznsgi tblkkal. (b) Egy tbbszrsen
sszekttt hl csoportostott ekvivalense. ................................................................................... 450
14.12. Egy mintavtelez algoritmus, amely esemnyeket generl egy Bayes-hlbl ................. 451
14.13. Az elutast mintavtel algoritmusa, ami Bayes-hls lekrdezseket vlaszol meg bizonytkok
esetn .............................................................................................................................................. 452
14.14. A valsznsgi slyozs algoritmusa Bayes-hlban trtn kvetkeztetshez ................ 454
14.15. Az MCMC algoritmus Bayes-hlban trtn kzelt kvetkeztetshez .......................... 455
14.16. (a) Egy kt osztlyt (Professzor s Dik) ler RVM. Kt professzor s kt dik van, mindkt dik
konzulense KovcsProf. (b) Az (a)-beli RVM Bayes-hl ekvivalense. ........................................ 459
14.17. Egy Bayes-hl rszlete, ami egy olyan RVM-hez tartozik, amelyben a Konzulens(Jnos)
ismeretlen, de vagy KovcsProf, vagy MrProf. A konzulens vlasztsa az egyes professzorok
finanszrozstl fgg. Vegyk szre, hogy a Siker(Jnos) most mind a kt professzor Hrnev-tl fgg,
br a Konzulens(Jnos) rtke meghatrozza, hogy valjban melyiknek is van hatsa. ............... 460
14.18. Egy gpkocsi elektromos s motorikus rendszereinek rszeit ler Bayes-hl. Minden vltoz
binris, s az igaz rtk jelzi a megfelel funkci helyes mkdst. ............................................ 469
14.18. Hrom lehetsges hl a tvcsproblmra ......................................................................... 470
15.1. (a) Egy elsrend Markov-folyamathoz tartoz Bayes-hlstruktra. A reprezentlt Markovfolyamatban az llapotot az Xt vltozk definiljk. (b) Egy msodrend Markov-folyamat. ....... 475
15.2. Az esernys vilgot ler Bayes-hlstruktra s feltteles eloszlsok. Az lapottmenet-modell a
P(Est|Est1) feltteles valsznsg-eloszls, az rzkel modell a P(Esernytt|Est). ................. 476
15.3. A simts egy mltbeli k idpontban az llapot a posteriori P(Xk|e1:t) eloszlst szmtja ki egy teljes,
1-tl t-ig terjed megfigyels sorozat ismeretben ......................................................................... 479
15.4. Az elre-htra algoritmus, ami llapotok egy sorozatnak az a posteriori valsznsgeit szmtja ki
adott megfigyelsi sorozat ismeretben. Az ELRE s a HTRA mveleteket rendre a (15.3) s (15.7)
egyenletek definiljk. .................................................................................................................... 480
15.5. (a) Az Est lehetsges llapotsorozatait tekinthetjk egy tvezet tnak egy grfon, aminek
csompontjai a lehetsges llapotok az egyes idpontokban. (Az llapotokat ngyzetes csompont jelzi,
hogy flrerthetetlenl megklnbztessk ket egy Bayes-hl csompontjaitl.) (b) A Viterbialgoritmus mkdse az [igaz, igaz, hamis, igaz, igaz] megfigyelsi sorozatra. Minden t idpontra
feltntettk az m1:t zenet rtkeit, ami minden egyes t idpontbeli llapothoz megadja a legjobb, benne
vgzd sorozat valsznsgt. Minden egyes llapothoz egy vastag nyl is vezet, ami a legjobb eldjt
jelzi, a megelz sorozat valsznsgnek s az tmenet valsznsgnek a szorzata szerint. A vastag
nyilak visszafel kvetse az m1:5-beni legvalsznbb llapotbl pedig megadja a legvalsznbb
sorozatot. ........................................................................................................................................ 482
15.6. Egy lland d lpsnyi idklnbzettel simt algoritmus, folyamatos mkds (online)
algoritmusknt megvalstva: egy j idpontbeli megfigyelsre kiadja az j simtott becslst ...... 484
15.7. Egy Xt hely,
sebessg s Zt helymegfigyels alkotta lineris dinamikus rendszerhez tartoz
Bayes-hlstruktra ........................................................................................................................ 486
15.8. A Kalman-szrs frisstsi ciklusnak a lpsei egy vletlen bolyongs esetn. A vletlen bolyongs
a priori eloszlsa 0 = 0,0 s 0 = 1,0, az tmenet bizonytalansga x = 2,0, az rzkel bizonytalansga z
= 1,0, az els megfigyels pedig z1 = 2,5 (az x tengelyen csillaggal jellve).Vegyk szre, ahogy a P(x1)
elrejelzs ellapul a P(x0)-hoz kpest az tmenet bizonytalansga miatt. Vegyk azt is szre, hogy az a
posteriori P(x1|z1) kiss balra helyezkedik el a z1 megfigyelstl, mivel az tlag az elrejelzs s a
megfigyels slyozott tlaga. .......................................................................................................... 488
15.9. (a) A Kalman-szrs eredmnye egy XY skon mozg objektumnl, feltntetve a valdi (balrl
jobbra halad) plyagrbt, a zajos megfigyelsek egy sorozatt s a Kalman-szrs alapjn becslt
plyagrbt. A helybecslsek szrsait az ovlisok jelzik. (b) A Kalman-simts eredmnye ugyanarra a
megfigyelsi sorozatra. ................................................................................................................... 490
15.10. Egy fa fel repl madr (fellnzetben). (a) Egy Kalman-szr elrejelzse a madr helyzetre,
ami egyetlen Gauss-eloszls az akadly kzepre illesztve. (b) Egy valsghbb modell szmtsba veszi
a madr elkerl manvereit, s azt jelzi elre, hogy az egyik vagy a msik oldalon fog elszllni. 491
15.11. (a) Az esernys DBH-hoz tartoz a priori eloszls, az llapottmenet-modell s az rzkel modell
megadsa. Az sszes kvetkez szelet feltevsnk szerint az 1. szelet msolata. (b) Egy XY skon val
robotmozgshoz tartoz egyszer DBH. ........................................................................................ 493
15.12. (a) Fels grbe: az Akkumultort vrhat rtknek a plyagrbje egy olyan megfigyelsi
sorozatnl, ami csak 5-sket tartalmaz, kivve a 0-kat a t = 21 s a t = 22 idpontokban, egy egyszer
Gauss-hibamodell felhasznlsval. Als grbe: a plyagrbe, amikor a megfigyelsek 0-val folytatdnak
t = 21-tl. (b) Ugyanez a ksrlet az tmenetihiba-modellel elvgezve. Vegyk szre, hogy az tmeneti
hibt jl kezeli, de a vgleges hiba tlzott pesszimizmust eredmnyez. ......................................... 494
xxiv
Created by XMLmind XSL-FO Converter.
Mestersges Intelligencia
Mestersges Intelligencia
17.1. (a) Egy egyszer 4 3-as krnyezet, ami az gens szmra szekvencilis dntsi problma. (b) A
krnyezet llapottmenet-modelljnek illusztrlsa: a szndkolt kimenetel 0,8 valsznsggel
kvetkezik be, de 0,2 valsznsggel az gens oldalra mozdul a szndkolt irnyhoz kpest. A fallal val
tkzskor nincsen mozgs. A kt vgllapot jutalma a jelzett +1 s 1, az sszes tbbi llapot jutalma
0,04. ................................................................................................................................................ 538
17.2. (a) Egy optimlis eljrsmd a sztochasztikus krnyezetre R(s) = 0,04 esetn nem vgllapotoknl.
(b) Optimlis eljrsmdok R(s) ngy klnbz rtktartomnya esetn. .................................... 540
17.2. Az llapotok hasznossgai a 4 3-as vilgban, = 1 s a nem vgllapotoknl R(s) = 0,04 esetn
543
17.4. Az rtkiterci algoritmus az llapotok hasznossgnak kiszmtsra. A lellsi felttel a (17.8)
egyenletbl szrmazik. ................................................................................................................... 545
17.5. (a) A grafikonokon kivlasztott llapotok hasznossgainak a fejldse lthat az rtkiterci
felhasznlsnl. (b) A szksges rtkitercik szma (k), hogy a hiba garantltan legfeljebb = cRmax
legyen, c klnbz rtkeinl, mint a leszmtolsi tnyez fggvnye. ................................... 545
17.6. A hasznossgbecsls maximlis hibja ||Ui U|| s az eljrsmd vesztesge
az optimlis
eljrsmdhoz viszonytva az rtkiterci iterciszmnak fggvnyben ................................ 547
17.7. Az eljrsmd-itercis algoritmus egy optimlis eljrsmd kiszmtsra ........................ 549
17.8. (a) Az gens elhelyezkedsnek kezdeti valsznsgi eloszlsa. (b) tszri Balra mozgs utn. (c)
tszri Fel mozgs utn. (d) tszri Jobbra mozgs utn. ............................................................ 550
17.9. Egy dinamikus dntsi hl ltalnos struktrja. Az ismert rtk vltozk rnykoltak. A jelenlegi
idpont t, s az gensnek el kell dntenie, hogy mit tegyen azaz vlasztania kell egy rtket At szmra.
A hl hrom jvbeli lpsre van kibontva, s a jvbeli jutalmakat, valamint az elrelt horizonton
lv llapot hasznossgt brzolja. ............................................................................................... 553
17.10. A 17.9. brn lthat DDH elrenz megoldsnak egy rsze .......................................... 554
17.11. (a) s (b): Minimax jtkfk a ktujjas snblijtkhoz, ha a jtkosok a fordulkban tiszta stratgit
jtszanak. (c) s (d): Parametrizlt jtkfk, ahol az els jtkos kevert stratgit jtszik. A jutalmak
fggnek a kevert stratgia (p s q) valsznsgi paramtereitl. (e) s (f): A valsznsgi paramter
brmely konkrt rtknl a msodik jtkos a kt cselekvs kzl a jobbikat fogja vlasztani, gy az
els jtkos kevert stratgijnak az rtkt a vastag vonal jelli. Az els jtkos a kevert stratgia
valsznsgi paramtert a metszspontnl fogja megvlasztani. ................................................. 560
18.1. (a) Plda (x, f(x)) rtkprok s egy velk konzisztens lineris hipotzis. (b) Egy ugyanazokkal az
adatokkal konzisztens hetedfok polinom. (c) Egy msik adathalmaz egy pontosan illeszked hatodfok
polinommal, illetve egy kzelt lineris illesztssel. (d) Egy egyszer szinuszos illeszts ugyanazokra az
adatokra. ......................................................................................................................................... 573
18.2. Egy dntsi fa annak eldntsre, hogy vrjunk-e asztalra ................................................... 575
18.3. Pldk az tterem problmaterletre ...................................................................................... 577
18.4. A pldahalmaz attribtumtesztelssel trtn sztosztsa. (a) A Konyha alapjn trtn sztoszts
nem visz kzelebb ahhoz, hogy a pozitv s negatv pldkat megklnbztessk. (b) A Vendgek
attribtum tesztje jl szeparlja a pozitv s negatv pldkat. Miutn a Vendgek tesztjt elvgeztk, az
hes egy elgg j msodik tesztlehetsget ad. ............................................................................ 577
18.5. A dntsi fa tanulsra szolgl algoritmus ............................................................................ 578
18.6. A 12 plds tant minta halmazbl szrmaztatott dntsi fa ................................................ 579
18.7. Tanulsi grbe az tterem problmatrre vletlenszeren generlt 100 plda esetn. A grbe 20
ksrlet eredmnyt sszegzi. ......................................................................................................... 581
18.8. A egyttes tanuls eredmnyekppen nyert megnvekedett kifejezert illusztrl plda. Hrom
lineris kszb jelleg hipotzist vizsglunk, mindegyik a nem vonalkzott flskon ad pozitv besorolst.
Az egyttesben csak arra adunk pozitv osztlyozst, amelyre mindhrom pozitvat ad. Az eredmnyl
kapott hromszgterlet egy olyan hipotzisnek felel meg, amelyet az eredeti hipotzistr egyetlen eleme
sem kpes kifejezni. ........................................................................................................................ 585
18.9. A turb algoritmus mkdse. Mindegyik rnykolt tglalap egy pldnak felel meg, a tglalap
magassga mutatja a plda slyt. A pipk s keresztek mutatjk, hogy a pldt jl vagy rosszul
osztlyoztuk a pillanatnyi hipotzis alapjn. A dntsi fa mrete mutatja, hogy ennek a hipotzisnek
mekkora a slya a vgs egyttesben. ............................................................................................ 586
18.10. Az egyttes tanuls turb mdszereinek ADABOOST nev varinsa. Az algoritmus hipotzisek
kombincijt hozza ltre. A SLYOZOTT-TBBSG egy hipotzist generl. Ez az j hipotzis azt a
kimeneti rtket adja vissza, amely a h-ban tallhat hipotzisek kzl, a z-ben szmon tartott slyozssal
a legtbb szavazatot kapta. ............................................................................................................. 586
18.11. (a) A dntsi tnkk s a turbzott dntsi tnkk teljestmnynek az tterem pldn trtn
sszehasonltsa M = 5 esetn. (b) A tant halmazon s a teszthalmazon kapott j vlaszok arnya M-nek
xxvi
Created by XMLmind XSL-FO Converter.
Mestersges Intelligencia
xxvii
Created by XMLmind XSL-FO Converter.
Mestersges Intelligencia
lthat kevert Gauss-modellre vonatkoz grbe. (b) A 20.10. (a) brn lthat Bayes-hlra vonatkoz
grbe. .............................................................................................................................................. 641
20.10. (a) A cukorkk kevert modellje. A klnbz z cukorkk, a csomagolsok, valamint a lyukas
cukrok arnya a zsktl fgg, amelyet nem figyelnk meg. (b) Egy kevert Gaussra vonatkoz Bayes-hl.
Az X megfigyelhet vltoz tlaga s kovariancija a C komponenstl fgg. ............................... 642
20.11. Rejtett Markov-modellt reprezentl kitertett dinamikus Bayes-hl (a 15.14. bra megismtlse)
644
20.12. (a) A 20.8. (a) bra adatainak 128 pontos rszhalmaza, kt kivlasztott ponttal, s 10 legkzelebbi
szomszdjukkal. (b) Az adatok ellltsnl hasznlt kevert Gauss-eloszls 3D brja. .............. 647
20.13. A 20.12. (a) brn lthat adatokra vgzett srsgbecsls, k = 3 (a); k = 10 (b) s k = 40 (c) esetn
......................................................................................................................................................... 647
20.14. A 20.12. (a) brn lthat adatok srsgbecslse Gauss-kernelekkel, w = 0,02 (a); w = 0,07 (b) s
w = 0,20 (c) esetn. ........................................................................................................................ 648
xxviii
Created by XMLmind XSL-FO Converter.
Mestersges Intelligencia
21.1. (a) A 4 3-as vilgban alkalmazott stratgia. Ez optimlis stratgia, ha nem alkalmazunk
lertkelst, s minden llapotban, amely nem vgllapot, R(s)= 0,04. (b) A 4 3-as vilg llapotainak
hasznossga a stratgia esetn. .................................................................................................... 674
21.2. Egy adaptv lineris programozs alapon tanul passzv megerstses gens. A kd egyszerstse
rdekben feltettk, hogy minden egyes szlels sztbonthat egy szlelt llapotra s egy jutalomjelre.
676
21.3. A passzv ADP-tanul tanulsi grbi a 4 3-as vilg tanulsa sorn, a 21.1. brn lthat optimlis
stratgia hasznlata esetn. (a) Az llapotok egy kivlasztott rszhalmazra kiszmtott
hasznossgbecslsek a ksrletek szmnak fggvnyben. Figyeljk meg a 78-adik ksrlet krnykn a
jelents vltozsokat ez az els eset, amikor az gens a (4,2) vgllapotba jut, melyben 1 jutalmat kap.
(b) Az U(1,1) hibjnak RMS-rtke 20 egyenknt 100 ksrletbl ll futsra tlagolva. ..... 677
21.4. Egy idbeli klnbsg alapon hasznossgot tanul passzv megerstses gens ................. 678
21.5. Az IK-tanuls 4 3-as vilgon mrt tanulsi grbi. (a) Nhny kivlasztott llapot
hasznossgbecslse a ksrletszm fggvnyben. (b) Az U(1,1) becslsnek RMS-hibja, amelyet 20
futs tlagbl szmoltunk, mindegyik futs 500 ksrletet tartalmazott. Csak az els 100 ksrletbl
szrmaz eredmnyt rajzoltuk fel, hogy a grbe a 21.3. brval sszehasonlthat legyen. .......... 678
21.6. Annak a moh ADP-gensnek a felmutatott teljestmnye, amely vgrehajtja a tanult modell alapjn
optimlisnak tn cselekvst. (a) A kilenc nem vgllapot alapjn szmolt tlagos RMS-hiba. (b) Az a
szuboptimlis stratgia, amely fel ebben a ksrletsorozatban a moh gens konvergl. ............. 680
21.7. A felfedez ADP-gens teljestmnye, R+ = 2 s Ne = 5 esetn. (a) Nhny kivlasztott llapot
hasznossgnak becslse az id fggvnyben. (b) A hasznossgrtkek RMS-hibja, s az ehhez
kapcsolhat, a stratgibl szrmaz vesztesg. ............................................................................. 683
21.8. Egy felfedez Q-tanul gens. Egy aktv tanul, amely megtanulja minden cselekvsnek minden
egyes llapotban a Q(a, s) rtkt. Ugyanazt az f felfedezsi fggvnyt hasznlja, amelyet a felfedez
ADP-gens is hasznlt, de elkerli az llapottmenet-modell tanulst, mivel az llapot Q-rtkt
kzvetlenl a szomszdos llapotok Q-rtkeihez tudja kapcsolni. ............................................... 684
21.9. A mozg kocsi tetejn ll hossz rd egyenslyozsnak vizsglatra szolgl berendezs. A kocsit
az
llapotvltozkat megfigyel szablyz jobbra vagy balra lkheti. ........................... 688
21.10. Idben eltolt kpek egymsra msolsa tjn kapott ered kp, amelyen egy nagyon bonyolult
krberepls orral a kr kzppontja fele manvert hajtanak vgre. A helikoptert egy Pegasus
stratgiakeres algoritmussal fejlesztett stratgival vezrlik. Egy szimultormodellt fejlesztettek a vals
helikopter egyes vezrlsi beavatkozsokra adott vlaszainak vizsglatra. Ezek utn egsz jszaka
futtattk az algoritmust a szimultoron. Egy sor vezrlt fejlesztettek ki klnbz manverekre. Minden
esetben, amikor tvirnytst hasznltak, messze jobb volt az eredmny, mint a kpzett humn piltk. (A
kpet Andrew Ng engedlyvel kzljk.) ..................................................................................... 690
22.1. A kommunikciban rszt vev ht folyamat, a The wumpus is dead mondat felhasznlsval
700
22.2. Egy kommunikl gens, amely elfogad parancsokat, krdseket s lltsokat. Az gens lerhatja az
aktulis llapotot, valamint vgrehajthat hagyomnyos, nem szlsaktus cselekvst is, ha nincs mit
mondania. ....................................................................................................................................... 701
22.3. 0 szkincse ........................................................................................................................... 702
22.4. Az 0 nyelvtana, minden egyes szablyra plda kifejezst adva ........................................... 703
22.5. A the wumpus is dead lentrl felfel trtn elemzsi lpsei. A szavakat tartalmaz csompontok
listjval kezdnk. Ezek utn egy szably jobb oldalra illeszked rszsorozatokat felcserlnk egy j
csomponttal, amelynek gykere a szably bal oldala. Pldul a harmadik sorban az Article s Noun
csompontokat lecserljk egy NP csompontra, amelynek e kt csompont lesz a gyereke. A fentrl
lefel elemzs hasonl lpseket eredmnyezne, de pp a fordtott irnyban. ............................... 705
22.6. A The agent feels a breeze mondat diagramjnak egy rszlete. Mind a hat csompont lthat, de
csak hrom l szerepel azok kzl, melyek teljes elemzst eredmnyeznnek. ............................. 706
22.7. A diagramelemz algoritmus. S a kezd szimblum s S' egy j nem zr szimblum, diagram[j]
pedig azon lek listja, melyek a j csompontban vgzdnek. A grg bc beti nulla vagy tbb
szimblumbl ll fzrekre illeszkednek. ..................................................................................... 707
22.8. Az 0 I 1 feel 2 it 3 mondat diagramelemzse. Az m:S jells azt jelenti, hogy az m lnek egy S ll a
jobb oldaln, mg az f:VP/Verb azt, hogy az f lnek VP van a bal oldaln, de egy Verb-et vr. t teljes l
van a csompontok felett, s nyolc hinyos alattuk. ....................................................................... 708
22.9. Az 0 I 1 feel 2 it 3. elemzsi lpsei. Az am lek mindegyikre megmutatjuk azt az eljrst, amit az
l ms, a diagramon mr szerepl lekbl trtn szrmaztatsra hasznltunk. Bizonyos leket a rvidsg
rdekben elhagytunk. .................................................................................................................... 709
22.10. Egy balsarok-elemz algoritmussal elkerlhet a ride szval kezdd VP jslsa, de jsolni fog
egy was szval kezdd VP-t, mivel a nyelvtan egy NP-t kvet VP-t vr. A the horse gave feletti
xxix
Created by XMLmind XSL-FO Converter.
Mestersges Intelligencia
hromszg azt jelenti, hogy a szavaknak van egy RelCause elemzsk, amihez azonban kzvetlenl
tovbbi rszek kapcsoldnak, amik nem lthatk. .......................................................................... 710
22.11. Fell: Az 1 egy BNF nyelvtana, amely kezeli az alanyi s a trgyas esetet a fnvi kifejezsekben,
s ezrt annyira nem is generl tl. Az 1 nyelvtanval megegyez rszeket elhagytuk. Lent: Az 1 egy
definit klz nyelvtana (DCG). ........................................................................................................ 712
22.12. Pldk igkre az alkategria-listikkal egytt ..................................................................... 714
22.13. A You give me the gold (Ideadod nekem az aranyat) elemzsi fja, amely bemutatja az ige s az
igei kifejezs alkategriit .............................................................................................................. 715
22.14. Szemantikval kibvtett nyelvtan az aritmetikai kifejezsekre. Minden xi vltoz egy szszetev
szemantikjt reprezentlja. Vegye szre, hogy a {teszt} jellst hasznljuk olyan logikai prediktumok
definilsra, amelyeket ki kell elgteni, de nem sszetevk! ...................................................... 716
22.15. A 3 + (4 2) fzr elemzsi fja szemantikai rtelmezsekkel ....................................... 717
22.16. Egy nyelvtan, amely kpes egy elemzsi fa s szemantikai rtelmezs levezetsre a John loves
Mary (s hrom msik) mondat szmra ...................................................................................... 717
22.17. A John loves Mary fzr elemzsi fja szemantikai rtelmezsekkel .............................. 718
22.18. Minden szintaktikai kategria kvzilogikai formj kifejezsnek tpust mutat tbla. A t r
jells egy fggvnyt takar, amely egy t tpus argumentumot fogad, s r tpus eredmnnyel tr vissza.
Pldul a Preposition szemantikai tpusa object2 sentence, ami azt jelenti, hogy az elljrsz
szemantikja egy fggvny, amelyet ha kt logikai objektumra alkalmazunk, akkor egy logikai mondatot
eredmnyez. .................................................................................................................................... 720
22.19. Az Every agent smells a wumpus mondat elemzsi fja, amely mind a szintaktikai struktrt,
mind a szemantikai rtelmezseket mutatja .................................................................................... 720
22.20. Szemantikval elltott nyelvtan kvzilogikai formban ...................................................... 721
22.21. Koherenciarelcik listja (Hobbs, 1990) alapjn. Mindegyik relci kt, egymst kvet
szvegrszlet, S1 s S2 kztt ll fenn. ............................................................................................ 727
22.22. Az abcdbcabcd bemeneti szveget elemz nyelvtant tartalmaz Sequitur-rendszer futsi lpsei.
Egy S-re vonatkoz szablybl indulunk ki, s ezen szably vghez sorban minden egyes szimblumot
hozzadunk. Miutn a hatodik szimblumot is hozzadtuk, megkapjuk egy ismtld pr els
elfordulst: bc. Ezrt a bc mindkt elfordulst lecserljk egy j nem zrra, A-ra, s egy j szablyt
vesznk fel: A bc. Miutn hrom jabb szimblumot hozzraktunk a bemenethez, a kilencedik a bc egy
jabb ismtlst eredmnyezi, gy jra A-val helyettestjk. Ez az aA kt elfordulshoz vezet, ezrt egy
j nem zrval, B-vel helyettestjk. Miutn a tizedik, utols szimblumot is hozzraktuk, Bd kt
elfordulst kapjuk, ezrt lecserljk ket egy j nem zrval, C-vel. De B immr csak egyszer szerepel,
a C szably jobb oldaln, ezrt B-t a neki megfelel bvtssel, aA-val cserljk le. .................... 729
23.1. Viterbi-alap szszegmentl algoritmus. Egy szkzket nem tartalmaz szfzrt feldolgozva
megadja a legvalsznbb szavakra trtn szegmentcit. ........................................................... 739
23.2. Az 0 nyelvtan egy rszletnek valsznsgi krnyezetfggetlen nyelvtana (PCFG) s szkincse. A
szgletes zrjelben lev szm jelzi a valsznsgt annak, hogy az adott bal oldali szimblumot a
megfelel szably szerint rjuk t ................................................................................................... 740
23.3. A Minden wumpus bzlik mondat elemzsi fja, megadva minden egyes rszfa valsznsgt. A
teljes fa valsznsge 1,0 0,5 0,05 0,15 0,60 0,10 = 0,000225. Mivel a mondatnak ez az
egyetlen elemzse, ezrt ennyi a mondat valsznsge is. ............................................................ 740
23.4. A [Bayes information retrieval model] lekrdezs-valsznsgi IR-modellje a knyv els t
fejezett tartalmaz dokumentumgyjtemny felett. Megadjuk a szgyakorisgot mindegyik
dokumentum-sz prra, s a szavak szmt (N) az sszes dokumentumra. Kt dokumentummodellt
alkalmazunk, Di az i-edik dokumentumon alapul simtatlan unigram szmodell, mg D'i ugyanaz a modell
adj-hozz-egyet simtssal, majd kiszmtjuk a lekrdezs valsznsgt minden dokumentumra mindkt
modellel. A jelen (23.) fejezet az egyrtelm gyztes, mindkt modell esetn tbb mint ktszzszor
valsznbb, mint brmely ms dokumentum. ............................................................................... 744
23.5. Egy gpi fordt rendszer vlasztsi lehetsgeit brzol sematikus diagram. A fenn tallhat angol
szveggel kezdjk. A kztes nyelven alapul rendszer a folytonos vonalakat kveti, az angol szveget
elszr szintaktikai elemzsnek veti al, majd szemantikai s kztes nyelvi reprezentcit llt el, vgl
szemantikai, szintaktikai s lexikai formkon keresztl francia szveget llt el. Az tvitelalap
rendszerek a szaggatott vonalak ltal jellt rvidzrakat hasznljk. Az egyes rendszerek eltr szinteken
vgzik az tvitelt, egyes rendszerek tbb szinten is. ....................................................................... 753
24.1. A kpalkots geometrija a sttkamrban ............................................................................ 763
24.2. Az emberi szem vzszintes keresztmetszete .......................................................................... 765
24.3. (a) Egy asztalon lv tzgp fnykpe. (b) Az (a) egy 12 12 kppontbl ll, nagytott rszlete.
(c) A rszletnek megfelel kpfnyessgrtkek egy 0-tl 255-ig tart skln. ............................. 765
xxx
Created by XMLmind XSL-FO Converter.
Mestersges Intelligencia
24.4. Klnfle lek: (1) mlysgi diszkontinuits, (2) felleti orientci diszkontinuits, (3)
viszszaverdsi kpessg diszkontinuits, (4) fnyessgi diszkontinuits (rnykok) ................... 768
24.5. (a) Egy asztalon nyugv tzgp fnykpe. (b) Az (a) alapjn meghatrozott lek. ............. 768
24.6. Fell: Az I(x) intenzitsprofil egy egydimenzis rszlet mentn egy lpcsfok ln t. Kzpen: Az
intenzits derivltja, I'(x). A fggvny nagy rtkei leknek felelnek meg, de a fggvny zajos. Lent: Az
intenzits simtott vltozatnak derivltja, (I G )', amely I G'-hoz hasonlan egy lpsben szmolhat.
Az x = 75 pontban lev zajos l jellt eltnt. .................................................................................. 768
24.7. (a) Rubik-kocka egy forg lemezkorongon. (b) Ugyanaz a kocka 19/30 msodperccel ksbb
(Richard Szeliski nyomn). (c) Az (a) s (b) kpek sszehasonltsa alapjn szmolt optikai folyam
vektorok (Joe Weber s Jitendra Malik hozzjrulsval). ............................................................. 772
24.8. (a) Egy olyan videokp-sorozat ngy kockja, amelyben a kamera a trgyhoz kpest mozgott s
forgott. (b) A sorozat els kpkockja, amelyen apr ngyzetek jelzik a tulajdonsgfelismer ltal
megtallt tulajdonsgokat (Carlo Tomasi hozzjrulsval). ......................................................... 773
24.9. (a) A 24.8. brn lthat kp tulajdonsgai elhelyezkedsnek hromdimenzis rekonstrukcija. (b)
A valdi hz ugyanabbl a perspektvbl. .................................................................................... 773
24. A trbeli lts alapgondolata: klnbz kamerapozcik ugyanannak a hromdimenzis jelenetnek
kiss eltr ktdimenzis nzeteit eredmnyezik ........................................................................... 774
24.11. A diszparits s a mlysg sszefggse a sztereoltsban ................................................. 774
24.12. (a) A textragradienseket illusztrl jelenet. Feltve, hogy a vals mintzat egyforma, lehetv
teszi a fellet irnygnak a meghatrozst. A szmtott irnyt a kpen oly mdon elhelyezett fehr kr
s nyl jelzi, mintha a krt a felletre festettk volna abban a pontban. (b) Egy velt fellet alakjnak
meghatrozsa a mintzat alapjn. (A kpeket Jitendra Malik s Ruth Rosenholtz hozzjrulsval
kzljk [Malik s Rosenholtz, 1994].) .......................................................................................... 775
24.13. Egy felidz vonalas rajz (Isha Malik hozzjrulsval) ..................................................... 777
24.14. Klnfle vonalcmkk ........................................................................................................ 778
24.15. A trideres cscsok ngy fajtja .......................................................................................... 778
24.16. A 24.15. brn 1-gyel jellt cscs klnbz elfordulsai ................................................ 779
24.17. A HuffmanClowes-cmkekszlet ....................................................................................... 779
24.18. Kt hromdimenzis trgy tbbfle nzete .......................................................................... 782
24.19. Egy arcmegtall algoritmus eredmnye (Henry Schneiderman s Takeo Kanade hozzjrulsval)
......................................................................................................................................................... 783
24.20. Alakzatkontextus-szmts s -illeszts. (a, b) Kt alakzat lnek mintapontjai. (c) Az
alakzatkontextus szmtsra hasznlt log-polr hisztogram rekeszek brja. 5 rekeszt hasznlunk a log r
s 12 rekeszt szmra. (df) Az (a) s (b) brn jellt referenciamintk alakzatkontextusai: , , .
Minden alakzatkontextus a maradk ponthalmaz koordintinak log-polr hisztogramja a referenciapontot
mint origt hasznlva. (A stt cellk tbb pontot jelentenek a rekeszekben.) Vegye szre a s pontok
alakzatkontextusainak vizulis hasonlsgt, amelyeket a kt alakzat relatve hasonl pontjaira
szmoltunk! Ezzel ellenttben a alakzatkontextusa egszen eltr. (g) Az (a) s (b) kztt ktoldali
illesztssel megtallt megfeleltetsek, a hisztogramok 2 tvolsga ltal definilt kltsget hasznlva. 784
24.21. Az illesztsalgoritmus informlis lersa ............................................................................. 786
24.22. (a) A tzgp fnykpn tallt sarkok. (b) Az eredeti kpre rhelyezett hipotetikus rekonstrukci
(Clark Olson hozzjrulsval). ...................................................................................................... 787
24.23. Az t kpe egy autban lv kamerval lefnykpezve. A vzszintes fehr cskok jelzik azokat a
keressi ablakokat, amiken bell a vezrl az tvonali jeleket keresi. A gyenge kpminsg nem szokatlan
az alacsony felbonts fekete-fehr videk esetben. .................................................................... 787
24.24. A megcmkzend objektum, amelynek minden sarokpontja trideres ............................... 792
24.25. Fellnzeti kp egy ktkamers ltrendszerrl, amely egy veget figyel meg, amely mgtt egy
fal van ............................................................................................................................................. 793
25.1. (a) A NASA Sojourner mobil robotja, amely a Mars felsznt dertette fel 1997 jliusban. (b) A
Honda P3 s Asimo elnevezs humanoid robotjai. ....................................................................... 795
25.2. (a) A mobil robotoknl npszer SICK LMS lzeres tvolsgmr. (b) Egy horizontlisan felszerelt
tvolsgmr ltal mrt visszaverdsi kp 2D-s trkpre vettve. ................................................ 796
25.3. (a) A Stanford manipultor: egy korai robotkar t rotcis (R) s egy transzlcis (prizmatikus)
csuklval (P), sszesen hat szabadsgfokkal. (b) Egy elskerk-kormnyzs nemholonomikus
ngykerek jrm mozgsa. ........................................................................................................... 798
25.4. (a) Marc Raibert egyik lpeget robotja mozgs kzben. (b) A Sony AIBO robot focizs kzben
(copyright 2001, The RoboCup Federation). .................................................................................. 799
25.5. A robotrzkels felfoghat gy, mint cselekvsek s mrsek sorozatnak idbeli egymsra hatsa,
ahogy ezt a dinamikus Bayes-hl is illusztrlja ............................................................................ 800
xxxi
Created by XMLmind XSL-FO Converter.
Mestersges Intelligencia
25.6. (a) Egy mobil robot egyszerstett kinematikai modellje. A robotot a kr jelkpezi, s a bevgs
mutatja a haladsi irnyt. Kln-kln lthatjuk a t-beli s a t + 1-beli pozcit s orientcit a vt t s t
t frisstsi rtkekkel. Szintn fel van tntetve egy t idpontban megfigyelt referenciapont (tereptrgy) az
(xi, yi) pontban. (b) A psztz tvolsgmrs modellje. Egy adott tvolsg mrshez (z1, z2, z3, z4) tartoz
kt lehetsges robothelyzet lthat. Sokkal valsznbb, hogy a bal oldali helyzetbl szrmaznak a
tvolsgmrsek. ............................................................................................................................. 801
25.8. A Monte Carlo lokalizci, egy rszecskeszr algoritmus mobil robotok pozcijnak
meghatrozsra. Fell: a kezdeti, teljes bizonytalansg. Kzpen: nagyjbl ktplus bizonytalansg,
miutn a robot elindult a kzps (szimmetrikus) folyosn. Alul: egyetlen pont kr szklt
bizonytalansg, miutn bement az egyik irodba. .......................................................................... 802
25.7. A Monte Carlo lokalizl algoritmus, fggetlen zajjal terhelt psztz tvolsgmrses modellt
hasznlva ........................................................................................................................................ 804
25.9. Egydimenzis, linearizlt mozgsi modell illusztrlsa: (a) Az f fggvny s t + 1 idpontbeli t
kzprtke s kovariancija (t alapjn). (b) A linearizlt vltozat az f rintje a t pontban. A t
kzprtk ugyanaz marad, ugyanakkor az elrevettett
kovariancia mr klnbzik a t+1-tl. 804
25.10. Plda a kiterjesztett Kalman-szr hasznlatra lokalizcis problmhoz. A robot egy egyenes
mentn mozog. Ahogy halad elre, a sajt helyzetnek ismerethez tartoz bizonytalansg fokozatosan
n, ahogy azt a hibaellipszisek mutatjk. Amikor szrevesz egy ismert pozcij referenciapontot, a
bizonytalansg cskken. ................................................................................................................. 805
25.11. A KKSZ alkalmazsa a robottrkpezs problmjra. A robot plyja a szaggatott vonal, s a
besatrozott ellipszisek jelentik helyzetre vonatkoz sajt becslseit. Nyolc pont jelenti az ismeretlen
helyzet referenciapontokat, mg a helyzetkre vonatkoz becslseiket a fehr ellipszisek mutatjk. Az
(a), (b) s (c) brkon a robot helyzetre vonatkoz becsls bizonytalansga folyamatosan nvekszik,
ahogy azok a referenciapontok is, amelyek mellett elmegy. A (d) brn a robot jra elrkezik az els
referenciaponthoz, gy az sszes tbbi pont helyzetnek bizonytalansga is cskken, ksznheten annak,
hogy a becslsek korrelltak. .......................................................................................................... 806
25.12. (a) Egy kt szabadsgfok robotkar munkatere. A munkatr egy doboz, amiben egy lapos akadly
lg a mennyezetrl. (b) Ugyanennek a robotnak a konfigurcis tere. A fehrrel jelzett terlet jelenti
azokat a konfigurcikat, ahol a robot nem tkzik ssze semmivel. A pont az brn a robot bal oldali
konfigurcijt mutatja. .................................................................................................................. 809
25.13. Hrom klnbz robotkonfigurci a munkatrben s a konfigurcis trben ................. 810
25.14. (a) A kltsgfggvny s az ellltott trajektria a konfigurcis trben, diszkrt hls
celladekompozcis kzelts esetn. (b) Ugyanaz az tvonal a munkatrben brzolva. rdemes
megfigyelni, hogy a robot behajltja a knykt, hogy elkerlje a fggleges akadlyt. ............... 811
25.15. (a) A taszt potenciltr tvol tartja a robotot az akadlyoktl. (b) A megoldsknt kapott plya, ha
egyszerre minimalizljuk az thosszt s a potencilfggvnyt. ...................................................... 812
25.16. (a) A Voronoi-diagram azon pontok halmaza a konfigurcis trben, amelyek egyenl tvolsgra
vannak kt vagy tbb akadlytl. (b) A szabad tr 400 vletlenszeren kivlasztott pontjbl felptett
valsznsgi thlzat. .................................................................................................................. 813
25.17. Egy ktdimenzis krnyezet, a sebessg vektor bizonytalansgt brzol kppal. A vezrls
bizonytalansga miatt az eredeti szndknak megfelel v sebessg valjban brmilyen vektor lehet a Cv
kpon bell. Ennek eredmnyekppen a robot vgs konfigurcija brhol lehet a burkoln (a
vilgosabban rnyalt terleten), azaz nem tudjuk, hogy eljutottunk-e a lyukba, vagy sem. ........... 816
25.18. Az els mozgsparancs s a lehetsges robotmozgsok burkolja. A hibtl fggetlenl tudjuk,
hogy a vgs konfigurci a lyuk bal oldaln lesz. ........................................................................ 816
25.19. A msodik mozgsparancs s a lehetsges mozgsok. Mg hibk esetn is vgl bele fogunk tallni
a lyukba. ......................................................................................................................................... 817
25.20. Robotkarvezrls (a) egysgnyi ersts arnyos szablyozval; (b) 0,1-es erstsi tnyezj
arnyos szablyozval; (c) PD szablyozval, 0,3-as ersts arnyos taggal s 0,8-as differencil
komponenssel. Mindhrom esetben a robotkar a szrkvel jellt plyt prblta kvetni. ............ 818
25.21. Potenciltr-vezrls. A robot egy potenciltrben halad, amely az akadlyoktl taszt erkbl s a
clkonfigurcihoz vonzkbl ll. (a) Sikeres tvonal. (b) Loklis optimum. ............................... 820
25.22. (a) Hexapod robot. (b) Kiterjesztett vges automata (KVA) (augmented finite state machine,
AFSM) egyetlen lb vezrlshez. Fontos, hogy ez a KVA-szenzoros visszacsatolsra reagl: ha a lb
megakad az elremozgats sorn, akkor magasabbra emeli. .......................................................... 821
25.23. (a) A Helpmate robot lelmiszert s egyb orvosi felszerelst szllt tbb tucat krhzban,
vilgszerte. (b) Sebszrobotok a mtben (da Vinci Surgical Systems). ........................................ 825
25.24. (a) Egy elhagyatott bnya feltrkpezse egy robottal. (b) A bnynak a robot ltal kapott 3D kpe.
......................................................................................................................................................... 825
25.25. Diagram a 25.5. feladathoz .................................................................................................. 830
xxxii
Created by XMLmind XSL-FO Converter.
Mestersges Intelligencia
25.26. Egyszerstett robot egy labirintusban. Lsd 25.6. feladat. ................................................. 832
27.1. Egy modell- s hasznossgalap gens, ahogyan elszr a 2.14. brn bemutattuk ............. 851
27.2. A kompills clja a megfontolt (deliberatv) dntshozatal hatkonyabb, reflexszer
mechanizmuss val talaktsa ..................................................................................................... 853
xxxiii
Created by XMLmind XSL-FO Converter.
Elsz
A mestersges intelligencia (MI) nagyon nagy terlet, s ez a knyv is igen terjedelmes. A knyvben
megksreltk e terletet teljes szlessgben feltrni: tlelve a logikt, a valsznsg-szmtst, a folytonos
matematikt, az rzkelst, a kvetkeztetst, a tanulst, a cselekvst, valamint mindent, a mikroelektroniktl a
vilgrt kutat robotokig. A knyv azrt is terjedelmes, mert bizonyos mrtkig el is mlyednk az eredmnyek
trgyalsban, mikzben az egyes fejezetek kzponti rszben csak a leglnyegesebb gondolatokat igyeksznk
bemutatni. Tovbbi eredmnyekre az egyes fejezetek vgn tallhat irodalmi feljegyzsekben mutatunk r.
A knyv alcme modern megkzeltsben. E taln nmagban res szfordulat szndkolt jelentse az, hogy
az ismert eredmnyeket egy kzs keretbe szintetizlva igyekeztk bemutatni, ahelyett hogy az MI egyes
rszterleteit kln-kln a sajt trtnelmi htterkben trgyaljuk. Elnzst is krnk mindazoktl, akik a sajt
szakterletket gy a szoksosnl kevsb ismerik fel.
A knyv f egysgest motvuma az intelligens gens koncepcija. Felfogsunkban az MI egyszeren a
krnyezetket szlel s cselekv gensek tanulmnyozsa. Minden ilyen gens egy rzkelseket
cselekvsekre lekpez fggvnyt valst meg. A knyvben e fggvnykapcsolat tbbfle reprezentcijval
foglalkozunk, olyan reprezentcikkal, mint pldul a produkcis rendszerek, a reaktv gensek, a vals idej
feltteles tervkszt rendszerek, a neurlis hlk s a dntselmleti rendszerek. A tovbbiakban bemutatjuk a
tanuls szerept, mint a rendszerterveznek azt a mdszert, amivel ismeretlen krnyezeteket is kpes
figyelembe venni, s megmutatjuk, hogy a tanuls milyen korltozsokat jelent az gens tervezsben, kiemelve
az explicit tudsreprezentci s a kvetkeztets szerept. A robotikt s a gpi ltst nem fggetlenl definilt
problmaknt trgyaljuk, hanem mint a cl elrshez szksges szolgltatsokat. Kln hangslyozzuk a
feladatkrnyezet fontossgt az gens megfelel megtervezse szempontjbl.
A f clunk azokat a gondolatokat tadni, amelyek az MI-kutats elmlt 50 vben s a kapcsold terleteken
az elmlt ktezer vben szlettek. E gondolatok bemutatsnl, mikzben a precizits megtartsra trekedtnk,
igyekeztnk kerlni a tlzott formalizmust. Ahol alkalmasnak talltuk, pszeudokd szint algoritmusokat is
kzltnk, hogy a gondolatok konkrt alakot ltsenek. Az ltalunk hasznlt pszeudokdot rviden a B)
fggelkben rjuk le. A klnbz programozsi nyelveken implementlt algoritmusokat az olvas a
http://aima.cs.berkeley.edu weboldalon tallja meg.
A knyvet alapveten egy alapkpzsbeli trgyhoz vagy trgysorozathoz szntuk. Ugyanakkor hasznlhat a
gradulis kpzs trgyaiban is (esetleg az irodalmi megjegyzsekben javasolt forrsok nmelyiknek
hozzadsval). A szles tmalefeds s a nagyszm rszletezett algoritmus miatt a knyv alapreferenciaknt
szolglhat az MI-szakos vgzs hallgatk s a szkebb kutatsi terletkbl kitrni kvn szakemberek
szmra. Egyetlen felttel a szmtgpes tudomnyok alapvet fogalomszint ismerete (algoritmusok,
adatstruktrk, komplexits) egy els-msodves hallgat szintjn. Az analzis alsbb ves szint ismerete jl
jn a neurlis hlk s a statisztikai tanuls rszleteinek megrtshez. A szksges matematikai httr egyes
rszeit az A) fggelkben adjuk meg.
A knyv ttekintse
A knyv nyolc rszbl ll. Az I. rsz, a Mestersges intelligencia az MI-kutatsok olyan megkzeltst adja,
amely az intelligens gens elkpzels kr szervezdik. Egy olyan rendszer kr, amely kpes eldnteni, hogy
mit cselekedjen s amely cselekedni is kpes. A II. rsz, a Problmamegolds olyan dntsi mdszerekkel
foglalkozik, amikor nhny lpsre elre kell gondolkodni. Ilyen pl. a sakk vagy a nylt terepen trtn
navigls. A III. rsz, a Tuds s kvetkeztets a vilgrl alkotott tuds reprezentlsval foglalkozik, valamint
azzal, hogy hogyan mkdik egy ilyen reprezentci, milyen reprezentcikat ismernk, hogyan
befolysolhatjuk ezeket a cselekvsnkkel, s hogy ezzel a tudssal hogyan lehet logikusan kvetkeztetni.
Ennek folytatsaknt a IV. rsz, a Tervkszts e kvetkeztetsi mdszerek hasznlatt mutatja a cselekvs
eldntsben, pontosabban a tervek ksztsben. Az V. rsz, a Bizonytalan tuds s kvetkeztets hasonlt a
III. s IV. rszekre, de a bizonytalansgok melletti kvetkeztetsre s dntshozatalra koncentrl. Ilyen
problmkra pl. az orvosi diagnosztizl s kezel rendszerekben kell szmtani.
A II.-tl az V. rszig az anyag az intelligens genseknek azzal a komponensvel foglalkozik, amely a
dntshozatalrt felels. A VI. rsz, a Tanuls a dntshoz komponens ltal ignyelt tuds megszerzsi
mdszereit rja le. A VII. rsz, a Kommunikci, szlels s cselekvs olyan mdszereket tr fel, amelyekkel
az intelligens gens a krnyezett rzkelheti lts, tapints, halls vagy akr nyelvmegrts rvn abbl a
clbl, hogy megtudja, mi trtnik krltte, tovbb olyan mdszerekkel foglalkozik, melyek kpesek az gens
xxxiv
Created by XMLmind XSL-FO Converter.
Elsz
terveit igazi cselekvss alaktani, ahol a cselekvs lehet egy robotmozgs, de akr nyelvi kzls is. Vgl a
VIII. rsz, a Konklzik az MI mltjt s jvjt, valamint a filozfiai s etikai kvetkezmnyeit elemzi.
Vltozsok az els kiadshoz kpest
Az els kiads ta az MI sok vltozson ment t, s ez a knyv is sokat vltozott. Lnyegben t is rtunk
minden fejezetet abbl a clbl, hogy a knyv tkrzze a kutats legjabb eredmnyeit, a korbbi munkknak az
j eredmnyekhez jobban illeszked rtelmezst adhassa, valamint hogy a gondolatok folyamnak oktat
jellege mg jobban rvnyeslni tudjon. Az MI kvetit btortani szeretnnk, hogy a mai mdszerek sokkal
praktikusabbak, mint az 1995-sek. A tervksztst pldnak vve az els kiads algoritmusai nhny tz
lpsbl ll tervek generlsra voltak kpesek, e kiads algoritmusai tbb tzezer lpsnyi tervekre
sklzhatk fel. Hasonl nagysgrendi javuls tapasztalhat a valsznsgi kvetkeztets, a nyelvfeldolgozs
s ms terletek esetben is. A knyvben az albbiak a legfontosabb vltozsok:
Az I. rszben mltatjuk a szablyozselmlet, a jtkelmlet, a gazdasgtan s a neurlis tudomnyok
trtnelmi szerept. Ez segti, hogy e gondolatokat a kvetkez fejezetekben integrltabb mdon tudjuk
trgyalni.
A II. rszben az online keressi algoritmusokkal foglalkozunk, s egy j, a korltozskielgtsrl szl
fejezetet is beiktattunk. Ez utbbi termszetes tmenetet kpez a logikval foglalkoz anyagrszek fel.
A III. rszben az tletkalkulus, amit az els kiadsban az elsrend logika fel vezet lpcsnek tekintettnk,
itt mint egy nll hasznos reprezentcis nyelv kerl bemutatsra, gyors kvetkeztetsi eljrsokkal s
ramkralap gensfejlesztssel. Az elsrend logikval foglalkoz fejezetet tszerveztk, hogy az anyag
ttekinthetbb legyen s alkalmazsi pldaknt az internetes vsrls trgyterlettel bvtettk.
A IV. rszben foglalkozunk olyan jabb mdszerekkel, mint a GRAPHPLAN s a kielgtsalap tervkszts.
Bvlt az temezs, a feltteles tervkszts, a hierarchikus tervkszts s a tbbgenses tervkszts
bemutatsa.
Az V. rszben a valsznsgi hlk anyagt j algoritmusokkal bvtettk, mint pldul a vltozeliminls
s Markov lnc Monte Carlo algoritmusok. Egy, a bizonytalan temporlis kvetkeztetsekkel foglalkoz j
fejezetet rtunk, ahol rejtett Markov-modellekrl, Kalman-szrkrl s dinamikus valsznsgi hlkrl van
sz. Mlyebb a Markov dntsi folyamat trgyalsa, j alfejezetek foglalkoznak a jtkelmlettel s a
mechanizmustervezssel.
A VI. rszben kapcsoljuk ssze a statisztikai, a szimbolikus s a neurlis tanulst tovbb a boosting
algoritmusokkal, az EM algoritmussal, a pldnyalap tanulssal s a kernelmdszerekkel (support vector
machines, szupport vektor gpek) foglalkoz rszekkel bvtjk anyagot.
A VII. rszben a nyelvfeldolgozs trgyalst a prbeszdmegrtssel s a nyelvtaninduklssal bvtjk. j
rsz foglalkozik a nyelv valsznsgi modellezsvel, az informci-visszakeressi s fordtsi
alkalmazsokkal. A robotika trgyalsnl kiemeljk a bizonytalan szenzoradatok egyestst. A ltssal
foglalkoz anyagrsz objektumfelismerssel bvlt.
A VIII. rszben egy j alfejezetben az MI etikai kvetkezmnyeivel foglalkozunk.
A knyv javasolt hasznlata
A knyvnek 27 fejezete van, mindegyik nagyjbl egyhetes eladsnyi anyagot jelent. Az egsz knyv
feldolgozsa kt flvet tenne gy ki. A tanfolyamot azonban a szkebb hallgati s eladi rdekldshez is
szabhatjuk. Mivel a knyv szles terletet fed le, j httranyag lehet egy rvid bevezet alapkurzushoz, de
felhasznlhat egyes tmakrket magasabb szinten bemutat specializlt gradulis kurzusokhoz is. A knyv
els kiadst felhasznl 600 egyetemi kurzus tematikjbl egy zelt az aima.cs.berkeley.edu weblapon
tallhat. Itt nhny hasznos tancs is tallhat arra nzve, hogy konkrt specilis ignyekhez hogyan
llthatunk ssze egy megfelel tmaszekvencit.
A knyv 385 gyakorlatot tartalmaz. Azokat, amelyekhez nagyobb llegzet programozsi munka is szksges,
egy klaviatra ikon jelzi. Az ilyen gyakorlatokat legjobban gy lehet megoldani, hogy ignybe vesszk az
aima.cs.berkeley.edu programkdtr szolgltatsait. Mretnl fogva nhny gyakorlat flves hzi feladatknt
is kiadhat.
xxxv
Created by XMLmind XSL-FO Converter.
Elsz
Olvasnival. A gyakorlatok egy rsze irodalmazst is ignyel. Ezeket egy nyitott knyv ikon jelzi.
Fontos
A knyvben a fontos rszeket egy mutat kz ikon jelzi. Hogy a knyvben az egyes tmkat knny
legyen megtallni, kiterjedt trgymutatt is ksztettnk.
A Weboldal hasznlatrl
Az aima.cs.berkeley.edu weboldalon megtallhatk:
a knyvbeli algoritmusok implementcija tbb klnbz programozsi nyelven;
a knyvet hasznl tbb mint 600 oktatsi intzmny listja, szmos webes linkkel az online oktatsi
anyagokhoz;
annotlt linkek listja tbb mint 800 olyan weboldalhoz, ahol hasznos MI-tartalom tallhat;
a segdanyagok s linkek fejezetenknti listja;
tmutat, hogy hogyan csatlakozhatunk a knyvvel foglalkoz vitafrumhoz;
tmutat, hogy a krdseinkkel s az szrevteleinkkel hogyan lphetnk kapcsolatba a szerzkkel;
tmutat, hogy a nagy valsznsggel elfordul hibkat hogyan jelezzk;
a knyvbeli brk, flik s ms oktatshoz hasznos anyagok.
Ksznetnyilvnts
A 24. fejezet (Az szlels) nagy rszt Jitendra Malik, a 25. fejezet (Robotika) tbbsgt az els kiadsban John
Canny, a jelen kiadsban pedig Sebastian Thrun rta. Az Irodalmi s trtneti megjegyzseket az els kiadshoz
Doug Edwards kutatta fel. Tim Huang, Mark Paskin s Cynthia Bruyns segtettek az brk s az algoritmusok
megfelel formj kialaktsban. A Prentice Hall kiadnl Alan Apt, Sondra Chavez, Toni Holm, Jake Warde,
Irwin Zucker s Camille Trentacoste minden tlk telhett megtettek, hogy rknyszertsenek bennnket a
hatridk betartsra, s sok hasznos javaslattal segtettk, hogy a knyv a megfelel tartalommal s megfelel
kntsben jelenjen meg.
Stuart meg szeretn ksznni szleinek a folyamatos tmogatst s btortst, felesgnek, Loy Sheflottnak a
vgtelen trelmt s a hatrtalan blcsessgt. Remli, hogy Gordon s Lucy rvidesen mr olvashatjk is ezt.
Igen segtksznek bizonyult az RKHC (Russell Kivteles Hallgati Csoportja) is.
Peter szeretn megksznni szleinek (Torsten s Gerda) az indttatst. Felesgnek (Kris), gyerekeinek s
bartainak kszni a btortst s azt, hogy elviseltk t a knyv megrsnak hossz ideje s a knyv trsnak
mg hosszabb ideje alatt.
Adsak vagyunk a Berkeley, a Stanford, az MIT s a NASA knyvtrosainak s a CiteSeer, tovbb a Google
fejlesztinek, hogy a kutats mdjt forradalmastottk.
Nem tudunk kln-kln ksznetet mondani mindenkinek, aki a knyvet hasznlta, s hasznos
megjegyzsekkel llt el, azonban az albb felsoroltak klnsen hasznos megjegyzseit meg szeretnnk
ksznni: Eyal Amir, Krzysztof Apt, Ellery Aziel, Jeff Van Baalen, Brian Baker, Don Barker, Tony Barrett,
James Newton Bass, Don Beal, Howard Beck, Wolfgang Bibel, John Binder, Larry Bookman, David R. Boxall,
Gerhard Brewka, Selmer Bringsjord, Carla Brodley, Chris Brown, Wilhelm Burger, Lauren Burka, Joao
Cachopo, Murray Campbell, Norman Carver, Emmanuel Castro, Anil Chakravarthy, Dan Chisarick, Roberto
Cipolla, David Cohen, James Coleman, Julie Ann Comparini, Gary Cottrell, Ernest Davis, Rina Dechter, Tom
Dietterich, Chuck Dyer, Barbara Engelhardt, Doug Edwards, Kutluhan Erol, Oren Etzioni, Hana Filip, Douglas
Fisher, Jeffrey Forbes, Ken Ford, John Fosler, Alex Franz, Bob Futrelle, Marek Galecki, Stefan Gerberding,
Stuart Gill, Sabine Glesner, Seth Golub, Gosta Grahne, Russ Greiner, Eric Grimson, Barbara Grosz, Larry Hall,
Steve Hanks, Othar Hansson, Ernst Heinz, Jim Hendler, Christoph Herrmann, Vasant Honavar, Tim Huang,
Seth Hutchinson, Joost Jacob, Magnus Johansson, Dan Jurafsky, Leslie Kaelbling, Keiji Kanazawa, Surekha
Kasibhatla, Simon Kasif, Henry Kautz, Gernot Kerschbaumer, Richard Kirby, Kevin Knight, Sven Koenig,
xxxvi
Created by XMLmind XSL-FO Converter.
Elsz
Daphne Koller, Rich Korf, James Kurien, John Lafferty, Gus Larsson, John Lazzaro, Jon LeBlanc, Jason
Leatherman, Frank Lee, Edward Lim, Pierre Louveaux, Don Loveland, Sridhar Mahadevan, Jim Martin, Andy
Mayer, David McGrane, Jay Mendelsohn, Brian Milch, Steve Minton, Vibhu Mittal, Leora Morgenstern,
Stephen Muggleton, Kevin Murphy, Ron Musick, Sung Myaeng, Lee Naish, Pandu Nayak, Bernhard Nebel,
Stuart Nelson, XuangLong Nguyen, Illah Nourbakhsh, Steve Omohundro, David Page, David Palmer, David
Parkes, Ron Parr, Mark Paskin, Tony Passera, Michael Pazzani, Wim Pijls, Ira Pohl, Martha Pollack, David
Poole, Bruce Porter, Malcolm Pradhan, Bill Pringle, Lorraine Prior, Greg Provan, William Rapaport, Philip
Resnik, Francesca Rossi, Jonathan Schaeffer, Richard Scherl, Lars Schuster, Soheil Shams, Stuart Shapiro, Jude
Shavlik, Satinder Singh, Daniel Sleator, David Smith, Brian So, Robert Sproull, Lynn Stein, Larry Stephens,
Andrea Stolcke, Paul Stradling, Devika Subramanian, Rich Sutton, Jonathan Tash, Austin Tate, Michael
Thielscher, William Thompson, Sebastian Thrun, Eric Tiedemann, Mark Torrance, Randall Upham, Paul
Utgoff, Peter van Beek, Hal Varian, Sunil Vemuri, Jim Waldo, Bonnie Webber, Dan Weld, Michael Wellman,
Michael Dean White, Kamin Whitehouse, Brian Williams, David Wolfe, Bill Woods, Alden Wright, Richard
Yen, Weixiong Zhang, Shlomo Zilberstein s a Prentice Hall nvtelen brli.
A knyv bortjrl
A bortn lthat kpet a szerzk szerkesztettk s Lisa Marie Sardegna s Maryann Simmons kivitelezte SGI
Inventor s az Adobe Photoshop segtsgvel. A cmlap az MI trtnetbl az albbiakat eleventi fel:
1. Arisztotelsz tervkszt algoritmusa a De Motu Animalium c. mbl (kb. i.e. 400).
2. Ramon Lull fogalomgenertora az Ars Magna c. mbl (1300 krl).
3. Charles Babbage Differencil Gpe, az els univerzlis szmtgp prototpusa (1848).
4. Az elsrend logika Gottlob Frege-fle formalizmusa (1789).
5. A logikai kvetkeztets Lewis Carroll-fle diagramjai.
6. A valsznsgi hlzat Sewall Wright-fle brzolsa (1921).
7. Alan Turing (19121954).
8. Shakey a Robot (19691973).
9. Egy korszer diagnosztikai szakrti rendszer (1993).
A Szerzkrl
Stuart Russell 1962-ben Portsmouth-ban, Angliban szletett. 1982-ben Oxfordban fizikbl szerzett
kitntetses oklevelet, majd 1986-ban a Stanfordon doktorlt szmtgpes tudomnyokbl. Ettl kezdve a
Kalifornai Berkeley Egyetemen (University of California at Berkeley) dolgozik, ahol jelenleg a szmtgpes
tudomnyok professzora, az Intelligens Rendszerek Kzpont igazgatja s a SmithZadeh mrnktudomnyi
tanszk vezetje. 1990-ben megkapta a Nemzeti Kutatsi Alap Fiatal Kutatk Elnki Djt, 1995-ben pedig
msodmagval a Szmtgp s a Gondolat Djat. 1996-ban a Miller Intzet sztndjas professzora volt a
Kaliforniai Egyetemen s 2000-ben megkapta a tekintlyes hromves, rektori kutati-professzori sztndjat.
1998-ban a Stanfordon Forsythe-emlkeladsokat tartott. Az Amerikai MI Trsasg tagja, korbban pedig a
trsasg vezetsgi tagja volt. Tbb mint 100 cikket publiklt az MI klnbz terleteirl. Tovbbi knyvei
kztt megtalljuk a The Use of Knowledge in Analogy and Induction s (Eric Wefalddal egytt) a Do the Right
Thing: Studies in Limited Rationality c. knyveket.
Peter Norvig a Search Quality rszleg vezetje a Google-nl. Az Amerikai MI Trsasg vezetsgi tagja.
Korbban a NASA Ames Research Centerben a Szmtstudomnyi Osztly igazgatja volt, ahol felgyelte a
NASA MI- s robotikai kutatsait s fejlesztseit. Ezt megelzen a Junglee-nl dolgozott tudomnyos
fmunkatrsknt, ahol hozzjrult az els internetes informcikinyer szolgltats kifejlesztshez, valamint a
Sun Microsystems Laboratoriesnl vezet kutatknt, ahol az intelligens informci-visszaszerzsen dolgozott.
Diplomjt alkalmazott matematikban a Brown Egyetemen, PhD-fokozatt, szmtgpes tudomnyokban, a
Kaliforniai Egyetemen Berkeleyben kapta. A Dl-kaliforniai Egyetemen professzorknt, a Berkeleyben,
Kaliforniban pedig a tanszki kutatcsoport tagjaknt dolgozott. Tbb mint 50 publikcija van a szmtgpes
tudomnyok terletn. Ezek kztt talljuk a Paradigms of AI Programming: Case Studies in Common Lisp,
Verbmobil: A Translation System for Face-to-Face Dialog s Intelligent Help System for UNIX c. knyveket.
xxxvii
Created by XMLmind XSL-FO Converter.
1. fejezet - Bevezets
Amelyben megksreljk megmagyarzni, hogy mirt tartjuk a mestersges intelligencit olyan terletnek, amit
igenis rdemes tanulmnyozni, s amelyben azt is megksreljk eldnteni, hogy vajon mi is ez a terlet.
Az ember Homo sapiensnek gondolkod embernek nevezte el a sajt fajtjt, mert mentlis kpessgeink
annyira fontosak a szmunkra. vezredek ta prbljuk megrteni azt, hogy hogyan gondolkozunk. Azt, hogy az
anyag nhny marknyi mennyisge hogyan kpes a sajt magnl sokkal nagyobb s bonyolultabb vilgot
szlelni, megrteni, a vilg alakulst megjsolni s manipullni. A mestersges intelligencia (artificial
intelligence), rviden MI (AI), mg tovbb is megy: az intelligens entitsok megrtse mellett ilyen entitsok
ptsvel is prblkozik.
Az MI az egyik legjabb tudomnyterlet. A munka kzvetlenl a msodik vilghbor befejeztvel kezddtt.
A mestersges intelligencia elnevezs 1956-ban szletett meg. A molekulris biolgival egyetemben az MI az
a terlet, amirl ms tudomnyterletek kutati gy nyilatkoznak, hogy n legszvesebben ezzel foglalkoznk.
Egy fizikushallgat teljes joggal gondolhatja, hogy Galilei, Newton, Einstein s msok mr minden j tlettel
rg ellltak. Ezzel szemben az MI-ben az Einstein-kaliber egynisgek eltt mg szabad az t.
Az MI jelenleg az ltalnos rendeltets terletektl, mint az szlels s a tanuls, egszen olyan specifikus
feladatokig, mint a gpi sakk, a matematikai ttelbizonyts, a gpi kltszet vagy az orvosi diagnzis, a
legklnbzbb rszterletek risi vlasztkt leli t. Az MI az intellektulis kpessgeket ignyl feladatokat
rendszerezi s automatizlja, s gy potencilisan relevns az rtelmes emberi cselekvs minden terletn. Ilyen
rtelemben az MI igazn univerzlis tudomny.
1. Mi az MI?
Eddig arrl beszltnk, hogy mirt izgalmas az MI, de nem mondtuk meg, hogy mi is valjban? Az MI
definciit, nyolc jelenlegi tanknyvet kvetve, az 1.1. bra mutatja. Ezek a defincik kt dimenzi mentn
rtelmezhetk. Az bra fels rszben levk a gondolati folyamatokat s a kvetkeztetst clozzk, mg az als
rszben levk trgya a viselkeds. A bal oldali defincik a sikert az emberi teljestmnyhez mrik, mg a jobb
oldaliak mrcje az intelligencia egy idelis koncepcija, amit mi racionalitsnak (rationality) fogunk nevezni.
Egy rendszer racionlis, ha tudshoz viszonytva helyesen cselekszik.
1
Created by XMLmind XSL-FO Converter.
Bevezets
Az idk folyamn mind a ngy irnyzat kvetre tallt. De ahogy ez vrhat volt, feszltsg uralkodik az
embercentrikus s a racionalitscentrikus irnyzatok kztt. 1 Az embercentrikus irnyzat szksgkppen
empirikus tudomny, hipotzisekkel s empirikus igazolssal.
A racionalitscentrikus megkzelts a matematikra s a mrnki tudomnyokra tmaszkodik. Mindegyik
csoport rgalmazta is, de segtette is a tbbi csoport munkjt. Nzzk most a ngyfle megkzeltst kicsit
rszletesebben.
2
Created by XMLmind XSL-FO Converter.
Bevezets
A Turing-teszt a krdez s a szmtgp kztti fizikai klcsnhatst szndkosan kerlte, mert egy szemly
fizikai szimulcija az intelligencihoz nem szksges. Az n. teljes Turing-teszt (total Turing-test) azonban
videojelet is fel kell dolgozzon, hogy a krdez tesztelni tudja az illet rzkelsi kpessgeit, valamint
tartalmazza annak a lehetsgt is, hogy a krdez az objektumokat tadhassa egy nylson keresztl. A teljes
Turing-teszt teljestshez a szmtgpnek szksge lesz:
gpi ltsra (computer vision), az objektumok rzkelshez s
robotikra (robotics) az objektumok mozgatshoz.
Ez a hat terlet nagyjbl lefedi az MI-t. Turing becsletre vlik, hogy egy olyan tesztet tallt ki, amely 50 v
mltval is relevns maradt. Az MI-n bell a kutatk sok erfesztst mgsem fejtettek ki a Turing-teszt
teljestse rdekben, abban a hiedelemben, hogy a mgtte sorakoz elvek tanulmnyozsa fontosabb, mint
egy pldny dupliklsa. A mestersges repls kutatsa akkor jrt sikerrel, amikor a Wright testvrek
abbahagytk a madarak utnzst, s az aerodinamikt kezdtk tanulmnyozni. A replssel foglalkoz knyvek
nem azt a clt fogalmazzk meg, hogy olyan gpeket kellene pteni, amelyek annyira hasonlan replnek a
galambokhoz, hogy ezzel akr ms galambokat is kpesek megtveszteni.
Bevezets
logikai jellsekkel kifejezett problmhoz megadni a problma megoldst. 2 Az MI-n bell uralkod logicista
(logicist) hagyomny azt remli, hogy ilyen programokra alapozva intelligens rendszereket kpes ltrehozni.
Ennek a megkzeltsnek kt alapvet baja van. Elszr is a logikai jellsrendszer ltal ignyelt formlis
elemekkel informlis tudst kifejezni nem ilyen egyszer, klnsen ha a tuds nem 100%-osan biztos. A msik
az, hogy nagy a klnbsg egy problma elvi, illetve gyakorlati megoldsa kztt. Mr a nhny tz tnyt
kitev problmk megoldsa is kimertheti egy tetszleges szmtgpes rendszer szmtsi erforrsait, hacsak
valamilyen mdon nincs vezrelve, hogy melyik kvetkeztetsi lpsekkel prblkozzk elszr. Annak
ellenre, hogy ez a kt problma a szmtgpes kvetkeztet rendszer brmilyen elven trtn fejlesztsnl
felbukkan, elszr a logicista hagyomnyban jelent meg.
Fontos
Emiatt az MI-nek mint racionlis gensek tervezsnek a tanulmnyozsa kt elnyt jelent. Elszr is
ez a megkzelts a gondolkods trvnye megkzeltsnl ltalnosabb, hiszen a korrekt
kvetkeztets csupn egyike a racionalitst biztost mechanizmusoknak. Msodszor, tudomnyosan
jobban is kezelhet, mint azok a megkzeltsek, amelyek az emberi viselkedsen vagy emberi
gondolkodson alapulnak, mert a racionalits mrtke jl definilt s teljesen ltalnos. Az emberi
viselkeds viszont egy bizonyos specifikus krnyezethez jl adaptldott, s rszben egy olyan
bonyolult, zmben nem ismert evolcis folyamat eredmnye, amely valsznleg mg messze ll a
tkletessgtl. Knyvnk teht a racionlis gensek ltalnos elveire s a ltrehozsukhoz szksges
komponensekre koncentrldik. Ltni fogjuk, hogy a problmamegfogalmazs ltszlagos
egyszersge ellenre, hihetetlen sok kvetkezmnnyel kell szembenznnk, ha megksreljk a
problmt megoldani. Nhny ilyen kvetkezmnyrl rszletesebben a 2. fejezet szl.
Egy fontos dologrl nem szabad elfeledkezni: rvidesen megltjuk, hogy sszetett krnyezetben a tkletes
racionalitst mindig helyesen cselekedni lehetetlen elrni. A szmtsi szksgletek egyszeren tl nagyok.
A knyv nagyobb rszben azonban azzal a munkahipotzissel fogunk lni, hogy a tkletes dntshozatal
megrtse j kiindulpont. A problma gy egyszerbb vlik, s megfelel keretet nyjt a terlethez tartoz
alapoz anyag tbbsghez. A korltozott racionalitssal (limited rationality) azaz megfelelen cselekedni,
mikzben az sszes kvnt szmts elvgzsre nincs elegend id explicit mdon a 6. s a 17. fejezet
foglalkozik.
4
Created by XMLmind XSL-FO Converter.
Bevezets
5
Created by XMLmind XSL-FO Converter.
Bevezets
(confirmation theory) megksrelte megvilgtani, miknt gyaraptja a tudst a tapasztalat. Carnap knyve, a
The Logical Structure of the World (Carnap, 1928) a tuds elemi tapasztalatbl trtn kinyersre egy explicit
szmtsi eljrst definilt. Ez volt taln az els olyan elmlet, amely az elmt szmtsi folyamatknt brzolta.
Az elme filozfiai kpnek utols eleme a tuds s a cselekvs kapcsolata. Az MI szempontjbl ez a krds
elsdleges fontossg, mert az intelligencia cselekvst is s kvetkeztetst is ignyel. Tovbb ahhoz, hogy
vilgos legyen elttnk, hogyan kell egy olyan genst pteni, amelynek cselekvsei jogosak vagy racionlisak
lesznek, meg kell rtennk, hogy hogyan igazolhatk a cselekvsek. Arisztotelsz a cselekvseket azrt tartotta
jogosnak, mert a clok s a cselekvsek kimenetelei kztt logikai kapcsolat lelhet fel (az albbi idzet zr
rsze a knyv bortjn is megtallhat):
De hogyan lehetsges, hogy a gondolatot nha kveti cselekvs, s nha nem, nha mozgssal
s nha anlkl? gy tnik, mintha ugyanaz a dolog trtnne itt is, mint ami a vltozatlan
objektumokra vonatkoz kvetkeztetsek meghozatalnl. De ebben az esetben az eredmny
egy spekulatv llts holott itt a premisszbl kvetkez konklzi egy cselekvs.
Kellene egy ruha, a kpeny egy ruha. Kell egy kpeny. Ami kell, azt el kell lltanom, s kell
egy kpeny. El kell lltanom egy kpenyt. A konklzi teht, hogy el kell lltanom egy
kpenyt nem ms, mint egy cselekvs.
(Nussbaum, 1978, 40. o.)
A Nicomachean Ethicsben (III. knyv, 3, 1112b) Arisztotelsz a tmt tovbb folytatja, egy algoritmust
javasolva:
Nem a clokat, hanem az eszkzket mrlegeljk. Az orvos nem azt fontolgatja, hogy
gygytson-e, a sznok sem, hogy meggyzzn-e, az llamfrfi sem azon hezitl, hogy jogot
s trvnyt teremtsen, s senki sem a clt mrlegeli. Mindenki felttelezi a clt, s azt
fontolgatja, hogy az hogyan, milyen eszkzkkel rhet el, s hogy azltal knnyen s a
lehet legjobban rhet-e el. s ha valamilyen eszkzzel elrhet a cl, azt fontolgatjuk, hogy
azzal az eszkzzel hogyan, milyen mdon rhetjk el, amg a legels okhoz el nem jutunk. Ez
az ok a felfedezs sorban a legutols s ami az elemzs rendjben az utols, a megtrtns
rendjben elsnek tnik. s ha lehetetlensghez jutunk, a keresst feladjuk, pldul ha pnzre
van szksgnk, azt viszont megszerezni nem lehet. Ha azonban valami lehetsgesnek tnik,
akkor megprblkozunk vele.
Arisztotelsz
Arisztotelsz megkzeltst 2300 vvel ksbb Newell s Simon a GPS-programjukban implementltk. Ma
ezt regresszis tervkszt rendszernek neveznnk (lsd 11. fejezet).
A clalap analzis hasznos, de nem segt akkor, amikor a clt tbb cselekvssel is el lehet rni, vagy pedig, ha
annak elrshez egy cselekvs sem elegend. Antoine Arnauld (16121694) helyesen adta meg azt a
kvantitatv formult, hogy ilyen esetekben milyen cselekvshez kellene folyamodni (lsd 16. fejezet). John
Stuart Mill (18061873) Utilitarianism c. mvben (Mill, 1863) a racionlis dnts kritriumnak a gondolatt
az emberi cselekvs minden aspektusra kiterjesztette. A dntshozatal egy jobban formalizlt elmletrl a
kvetkez rszben lesz sz.
6
Created by XMLmind XSL-FO Converter.
Bevezets
logikt, amely lnyegben manapsg a legalapvetbb tudsreprezentcis rendszer. 5 Alfred Tarski (19021983)
egy referenciaelmletet vezetett be, amely azt mutatja meg, hogy hogyan rendelhetk ssze a logika s a vals
vilg objektumai. A kvetkez lps annak a kidertse volt, hogy hol vannak a logiknak s a szmtsoknak az
alkalmazsi hatrai.
Az els nem trivilis algoritmusnak (algorithm) a legnagyobb kzs osztt kiszmt euklideszi algoritmust
tekintik. Az algoritmusok nmagban val tanulmnyozsa al-Hvrizmi, a 9. szzadi perzsa matematikus idejig
nylik vissza, akinek a mvei az arab szmokkal s az algebrval is megismertettk Eurpt. Boole s msok a
logikai dedukci algoritmusaival foglalkoztak, a 19. szzad vgn pedig mr erfesztsek trtntek az ltalnos
matematikai rvels logikai dedukciknt val formalizlsra. 1900-ban David Hilbert (18621943) 23
problmbl ll listt publiklt, amelyrl helyesen azt vlte, hogy matematikus trsait a szzad nagy
rszben le fogja ktni. Utols problmja azt firtatta, vajon ltezik-e a termszetes szmokra vonatkoz
tetszleges logikai llts igazsgt eldnt algoritmus. Ez a hres n. Entscheidungsproblem (eldnthetsgi
problma). Hilbert lnyegben azt a krdst tette fel, hogy a hatkony bizonytsi eljrsoknak vannak-e elvi
korltjai. Kurt Gdel (19061978) 1930-ban megmutatta, hogy a Frege s Russell-fle elsrend logikban
ltezik hatkony eljrs tetszleges igaz llts bizonytsra. Az elsrend logika azonban nem elegend a
matematikai indukci kifejezshez, ez utbbi viszont a termszetes szmok jellemzshez szksges. 1931-ben
Gdel meg is mutatta, hogy valban lteznek elvi korltok. Nemteljessgi ttele (incompleteness theorem)
kimutatja, hogy minden, a termszetes szmok tulajdonsgait kifejezni kpes nyelvben lteznek igaz, de abban
az rtelemben eldnthetetlen lltsok, hogy az igazsguk algoritmikusan nem mutathat ki.
Ez az alapvet eredmny gy is interpretlhat, hogy lteznek az egsz szmokon rtelmezhet olyan
fggvnyek, amelyek algoritmikusan nem rhatk le, magyarn nem szmthatk ki. Ez motivlta Alan Turingot
(19121954), hogy megksrelje a kiszmthat fggvnyek pontos jellemzst. Ez a megfogalmazs kiss
problematikus, mert egy szmtsi procedrnak vagy egy hatkony eljrsnak a formlis defincijt valjban
lehetetlen megadni. ltalnosan elfogadott azonban, hogy a ChurchTuring-tzis, amely azt lltja, hogy a
Turing-automata (Turing, 1936) kpes minden kiszmthat fggvnyt kiszmtani, elegend defincit
szolgltat. Turing azt is kimutatta, hogy vannak olyan fggvnyek, amelyeket semmilyen Turing-automata nem
kpes kiszmtani. gy pldul nincs olyan automata, amely ltalnossgban el tudn dnteni, hogy egy adott
program egy adott bemenetre vlaszt fog-e adni, vagy pedig rkk futni fog.
mbr az eldnthetetlensg s a kiszmthatsg fontos fogalmak a szmtsok megrtshez, a
kezelhetetlensgnek (intractability) sokkal nagyobb hatsa volt. Durvn fogalmazva a problmk egy osztlyt
kezelhetetlennek mondjuk, ha az egyes problmapldnyok megoldshoz szksges id legalbb
exponencilisan n a problmapldnyok nagysgtl fggen. A bonyolultsg polinomilis s exponencilis
nvekedse kztti klnbsgre elszr az 1960-as vek kzepn hvtk fel a figyelmet (Cobham, 1964;
Edmonds, 1965). A ktfajta nvekeds kztti klnbsg fontos, mert az exponencilis nvekeds
kvetkezmnye, hogy kzepes nagysg problmapldnyokat sem lehet rtelmes idkorlton bell megoldani.
Az intelligens viselkeds generlsnak ltalnos problmjt teht inkbb kezelhet, mint kezelhetetlen
rszproblmkra kellene lebontanunk.
Hogyan lehet egy kezelhetetlen problmt felismerni? A Stephen Cook s Richard Karp ltal tjra indtott NPteljessg (NP-completness) elmlete megadja r a vlaszt (Cook, 1971; Karp, 1972). Cook s Karp a kanonikus
kombinatorikus keressi s kvetkeztetsi problmk nagy osztlyra beltta, hogy azok NP-teljesek. Brmilyen
problmaosztly, amire egy NP-teljes problmaosztly visszavezethet, minden bizonnyal kezelhetetlen lesz (s
br mg senkinek sem sikerlt bebizonytani, hogy az NP-teljes problmk szksgszeren nem kezelhetk,
kevs tuds van ms vlemnyen). Ezek az eredmnyek lesen eltnek a szmtgp megjelenst ksr
elektronikus szuperagy Einsteinnl gyorsabb lelkesedstl. Az egyre nvekv szmtsi sebessg ellenre az
intelligens rendszerekre mindig jellemz lesz az erforrsok vatos s knyes hasznlata. Durvn fogalmazva, a
vilg egy rendkvl nagy problmapldny! Az utbbi vekben az MI segtett megrteni, hogy az NP-teljes
problmk egyes pldnyai mirt nehezek, holott msok knnynek bizonyulnak (Cheeseman s trsai, 1991).
A logikn s a szmtsokon tlmenen a matematika harmadik nagy hozzjrulsa az MI-hez a valsznsgelmlet (probability). A valsznsg gondolatt a szerencsejtkok lehetsges kimeneteleivel lerva
elszr az itliai Girolamo Cardano (15011576) fogalmazta meg. A valsznsg hamarosan felbecslhetetlen
komponense lett az sszes kvantitatv elmletnek, segtsget adva a bizonytalan mrsek s hinyos elmletek
kezelshez. Pierre Fermat (16011665), Blaise Pascal (16231662), James Bernoulli (16541705), Pierre
Laplace (17491827) s msok az elmletet tovbb fejlesztettk, s j statisztikai mdszereket vezettek be. A
Az elsrend logika Frege javasolta felrsa soha nem terjedt el. A nyilvnval okt knnyen megrtjk, ha a bortn lv pldra
pillantunk.
5
7
Created by XMLmind XSL-FO Converter.
Bevezets
valsznsgek felfrisstsi szablyt j tnyek hatsra Thomas Bayes (17021761) javasolta. A Bayesszably s az azon alapul Bayes-analzis az MI-rendszerekben alkalmazott bizonytalan kvetkeztets korszer
megkzeltsnek az alapja.
8
Created by XMLmind XSL-FO Converter.
Bevezets
Arisztotelsz azt rta, hogy az sszes llat kzl mrethez kpest az ember agya a legnagyobb. 6 Ennek
ellenre csak a 18. szzad kzeptl ismertk fel szles krben, hogy a tudat az agyban lakozik. Korbbi jelltek
kztt szerepelt a szv, a lp s a tobozmirigy.
1.2. bra - Az idegsejt vagy neuron rszei. Minden neuron sejttestbl vagy szmbl ll,
amely sejtmagot tartalmaz. A sejttestbl gazik el nhny dendritnek nevezett s egy
hossz, axonnak nevezett szl. Az axon j messzire elr, sokkal messzebbre, mint ahogy
ezt a jelen bra sugallja. Az axonok tipikusan 1 cm hosszak (ez a sejttest tmrjnek
100-szorosa), de elrhetik az 1 m-t is. Egy neuron 10100 000 ms neuronnal tart
kapcsolatot a szinapszisoknak nevezett csatlakozsokon keresztl. A jeleket neuronrl
neuronra egy sszetett elektrokmiai reakci tovbbtja. A jelek rvid tvon
szablyozzk az agy aktivitst, hossz tvon pedig befolysoljk a neuronok helyzett
s a kapcsoldsi rendszerket. gy tartjk, e mechanizmusok kpezik az agyi tanuls
alapjt. Az informcifeldolgozs zme az agykregben trtnik, ami az agy kls
rtege. A feldolgozs szervezeti egysge, gy tnik, egy kb. 0,5 mm-es tmrj
szvetoszlop, amelynek magassga az egsz kregre kiterjed, ez az embereknl kb. 4
mm. Egy oszlop kb. 20 000 neuront tartalmaz.
Paul Broca (18241880) afzia (beszdzavar) kutatsa agysrlt pcienseknl 1861-ben lkst adott e
terletnek, s meggyzte az orvosi szakmt, hogy az agynak lteznek lokalizlt, konkrt kognitv funkcikrt
felels rszei. Konkrtan azt mutatta ki, hogy a beszd ellltsa a bal flteke, most Broca-fle terletnek
nevezett rszre korltozdik.7 Ekkor tudtk mr, hogy az agy idegsejtekbl neuronokbl (neuron) ll, de
1873-ig, amikor Camillo Golgi (18431926) kifejlesztett egy festsi mdszert, nem tudtk az agyban az egyedi
neuronokat megfigyelni (lsd 1.2. bra). Ezt a mdszert alkalmazta Santiago Ramon y Cajal (18521934) az agy
neurlis struktrit feltr ttr munkjban.8
Ma mr vannak adataink arrl, hogy az agy egyes terletei s az ltaluk kontrolllt, vagy a szenzorikus
bemeneteket generl test rszei kztt milyen lekpezsek vannak. Az ilyen lekpezsek hetek alatt kpesek
Azta sikerlt felfedezni, hogy az egyes delfin- s cetfajtknl az agy relatv nagysga mg nagyobb. Most gy tartjk, hogy az emberi agy
tekintlyes nagysgt htrendszernek fejlettsge teszi lehetv.
7
Sokan Alexander Hoodot (Hood, 1824) idzik, mint lehetsges elsdleges forrst.
8
Golgi kitartott abban a hiedelmben, hogy az agyi funkcik egy folytonos kzegben valsulnak meg, amibe a neuronok be vannak
gyazva. Ezzel ellenttben Cajal a neurondoktrnt kpviselte. 1906-ban mindketten (megosztott) Nobel-djban rszesltek, de a dj
tvtelekor meglehetsen ellensges hangnem beszdeket tartottak.
6
9
Created by XMLmind XSL-FO Converter.
Bevezets
drasztikus vltozsokra, radsul egyes llatoknl gy tnik, tbbszrs lekpezseket tallhatunk. Azt azonban
mg nem teljesen rtjk, hogy az egyes terletek miknt veszik t ms rszek funkciit, ha azok megsrlnek.
Az egyedi emlkek trolsrl kis hjn semmilyen elmletnk nincs.
Az p agy aktivitsnak mrse 1929-ben kezddtt, amikor Hans Berger kidolgozta az elektroencefalogrfia
(EEG) elvt. A funkcionlis mgneses rezonancia (fMRI) kzelmltbeli kifejlesztse (Ogawa s trsai, 1990)
eddig nem ltott rszletessggel trja az idegsejtkutatk el az agy aktivitst, olyan mrsket is lehetv tve,
amelyek rdekes mdon korrellnak a zajl kognitv folyamatokkal. Az ismereteket kiegszti az egyedi sejt
szintjn trtn neuronaktivits rgztsnek fejldse. A nagymrtk fejlds ellenre mg messze vagyunk
attl, hogy megrtsk, hogy e kognitv folyamatok brmelyike valjban hogyan is mkdik.
Fontos
Az igazn csodlatos szrevtel az, hogy egyszer sejtek gyjtemnye elvezethet a gondolathoz, a
cselekvshez s a tudathoz, vagy ms szavakkal: az agytl eljutunk az elmhez (Searle, 1992). Az
egyedli elvi alternatva a miszticizmus: hogy ltezik egy misztikus vilg, ahol megvalsul az elme a
fizikai tudomnyok hatskrn tl.
Fontos
Az agy s a szmtgp igen eltr feladatokat vgeznek s eltr tulajdonsgokkal rendelkeznek. Az
1.3. bra azt mutatja, hogy az emberi agyban tipikusan 1000-szer tbb neuron van, mint ahny kapu
tallhat egy korszer szmtgp processzorban. A Moore-trvny9 alapjn meg lehet jsolni, hogy
egy processzorban lv logikai kapuk szma az agyi neuronok szmt 2020 krl ri el. Az ilyen
jslatokbl persze vajmi kevs kvetkeztetsre lehet jutni. Radsul a trolkapacitsbeli klnbsg
elenysz a kapcsolsi sebessgben s a prhuzamossgban mutatkoz klnbsgekhez kpest. Egy
szmtgpes chip nanomsodpercek alatt hajt vgre egy utastst, a neuronok ennl milliszor
lassabbak. Az agy ennl tbbet is kompenzl. Minden neuron s szinapszis egyidejleg aktv, holott a
legkorszerbb szmtgpeknek is csak egy vagy legfeljebb nhny processzora van. gy annak
ellenre, hogy a szmtgp a nyers kapcsolsi sebessgben milliszor gyorsabb, az agy
vgeredmnyben szzezerszer gyorsabban oldja meg a feladatait.
10
Created by XMLmind XSL-FO Converter.
Bevezets
11
Created by XMLmind XSL-FO Converter.
Bevezets
12
Created by XMLmind XSL-FO Converter.
Bevezets
jelentettek a behaviorista ortodoxia szmra (Rosenblueth s trsai, 1943). Nzetk szerint a clorientlt
viselkeds a hibt az aktulis llapot s a clllapot kztti klnbsget minimalizl szablyoz
mechanizmusbl fejldik ki. Az 1940-es vek vgn Wiener, Warren McCulloch-val, Walter Pittsszel s
Neumann Jnossal egytt egy sor konferencit szervezett, ahol a kognitv folyamatok j matematikai s
szmtsi modelljeivel foglalkoztak, s a behaviorista tudomnyok terletn sok tudsra voltak hatssal. Wiener
Cybernetics c. knyve (Wiener, 1948) bestseller lett, s rbresztette a szles publikumot az intelligens
mestersges gpek lehetsgre.
A korszer irnytselmlet, s klnsen ennek a sztochasztikus optimlis szablyozs nev ga olyan
rendszerek kifejlesztst tzte ki clul, amelyek egy clfggvnyt (objective function) maximalizlnak az
idben. Ez nagyjbl megegyezik az MI-rl alkotott kpnkkel: optimlisan viselked rendszereket fejleszteni.
Akkor mirt lett az MI s az irnytselmlet kt klnbz kutatsi terlet, hiszen megalkoti mg szoros
kapcsolatban is lltak egymssal? A vlasz forrsa az a szoros kapcsolat, amely a rsztvevk ltal ismert
matematikai technikk s az ezeknek megfelel, mindegyik vilgkpben megjelen problmk halmaza kztt
alakult ki. Az irnytselmlet eszkzei, a mtrixalgebra s az analzis folytonos vltozk rgztett halmazai
ltal lerhat rendszerekhez vezettek. Az egzakt analzis radsul tipikusan csak lineris rendszerek esetben
lehetsges. Az MI-t rszben azrt alkottk meg, hogy az irnytselmlet 1950-es vekbeli matematikjtl meg
tudjanak szabadulni. A logikai kvetkeztets s a szmts eszkzei lehetv tettk az MI-kutatk szmra,
hogy olyan problmkat is figyelembe vegyenek, mint a nyelv, a lts s a tervkszts, amelyek az
irnytselmleti clkitzseken teljesen kvl estek.
Bevezets
14
Created by XMLmind XSL-FO Converter.
Bevezets
15
Created by XMLmind XSL-FO Converter.
Bevezets
robotikus projektje az j Stanfordi Kutatintzetben (Stanford Research Institute, SRI).15 Ez a projekt amit
rszletesebben a 25. fejezetben trgyalunk volt az els, amely a logikai kvetkeztetst s a fizikai aktivitst
teljes egszben integrlta.
1.4. bra - Egy konkrt problma, amelyet Evans ANALOGY programja megoldott
Minsky a hallgatk egsz sort irnytotta, akik a megoldsokhoz lthatan intelligencit ignyl, korltos
problmkkal foglalkoztak. Ezeket a korltos problmaterleteket ksbb mikrovilgoknak (microworlds)
neveztk el. James Slagle SAINT nev programja (Slagle, 1963a) kpes volt az elsves analzis tanfolyamra
jellemz, zrt alakra hozhat integrlszmtsi feladatokat megoldani. Tom Evans ANALOGY programja (Evans,
1968) az IQ-tesztekben elfordul (lsd 1.4. bra) geometriai analgia jelleg problmkat oldotta meg. Daniel
Bobrow STUDENT programja (Bobrow, 1967) olyan algebrai feladvnyokat oldott meg, mint pldul az albbi:
Ha Tams gyfeleinek a szma ktszerese az ltala kzztett hirdetsek 20%-a ngyzetnek,
s Tams 45 hirdetst adott kzz, akkor hny gyfele van Tamsnak?
Bobrow, 1967
A mikrovilgok legismertebbike a kockavilg lett, amely egy asztalra (vagy gyakrabban egy szimullt asztalra)
helyezett tmr geometriai testekbl ll (lsd 1.5. bra). Az ilyen vilgban rtelmezett feladat a kockk egy
bizonyos trendezse egy olyan robotkar segtsgvel, amely egyszerre egyetlenegy kockt kpes megfogni. A
kockavilg otthont adott David Huffman gpi ltsi projektjnek (Huffman, 1971), David Waltz gpi ltsi s
knyszerterjeszts-kutatsnak (Waltz, 1975), Patrick Winston tanulsi elmletnek (Winston, 1970), Terry
Winograd termszetes nyelvfeldolgozsi programjnak (Winograd, 1972) s Scott Fahlman tervkszt
programjnak (Fahlman, 1974).
1.5. bra - Egy elrendezs a kockavilgban. A SHRDLU robot (Winograd, 1972) ppen
sikeresen teljestette a keresd meg azt a blokkot, ami a kezedben tartottnl magasabb,
s tedd a dobozba utastst.
Az angol nyelvben a tervkszt tervezs (planning) s a termket kszt tervezs (design) szpen elklnl. Hogy a pontos jelentst
hangslyozzuk, az angol planning fordtsnl a tovbbiakban tervksztst hasznlunk. (A ford.)
15
16
Created by XMLmind XSL-FO Converter.
Bevezets
A McCulloch s Pitts neurlis hlin alapul kezdeti kutats szintn virgzott. Winograd s Cowan eredmnyei
megmutattk, hogy a nagyszm elem hogyan kpes egyttesen egy egyedi fogalmat reprezentlni, mikzben
nveli a prhuzamossgot s a robusztussgot (Winograd s Cowan, 1963). Hebb tanulsi mdszereit Bernie
Widrow (Widrow s Hoff, 1960; Widrow, 1962) fejlesztette tovbb, aki a hlzatait adaline-oknak nevezte,
tovbb Frank Rosenblatt, aki a perceptronokat vezette be (Rosenblatt, 1962). Rosenblatt bebizonytotta
perceptron konvergencia ttelt (perceptron convergence theorem), kimutatva ezzel, hogy tanulsi
algoritmusa kpes a perceptron slyait gy mdostani, hogy az tetszleges bemeneti adatokhoz illeszkedjen,
feltve, hogy ilyen illeszkeds egyltaln lehetsges. Ezekrl a krdsekrl a 20. fejezetben runk majd.
Bevezets
tancsad bizottsg 1966-os jelentse azt llaptotta meg, hogy az ltalnos tudomnyos szveg fordtsa mg
nem megoldott, s a kzeljvben e tren gyors elrehalads nem is vrhat. Az egyetemi gpi fordtsi
projekteknek a kormny ltali finanszrozst Amerikban teljesen megszntettk. Manapsg a gpi fordts egy
nem tkletes, m szles krben alkalmazott eszkz mszaki, kereskedelmi, kormnyzati s
internetdokumentumok esetben.
Fontos
A msik nehzsget az jelentette, hogy sok olyan problma, amelyeket az MI ltal ksreltek
megoldani, kezelhetetlen volt. A korai MI-programok tbbsge gy dolgozott, hogy a problmra
vonatkoz alapvet tnyeket gpen reprezentlva, megold lpsszekvencikat prbltak ki, a
klnfle lpskombincikkal addig ksrletezve, amg nem leltek r a helyesre. A korai programok
azrt voltak hasznlhatk, mert a mikrovilgok csak kevs objektumot, s ebbl addan nagyon kevs
lehetsges cselekvst s nagyon rvid megoldsi sorozatokat tartalmaztak. Az NP-teljessg
elmletnek megfogalmazsa eltt ltalban azt tartottk, hogy a nagyobb problmkra felsklzni
csupn gyorsabb hardver s nagyobb memria krdse. A rezolcis ttelbizonyts kifejlesztst
ksr optimizmus pldul hamarosan lelohadt, amikor a nhny tucat tnynl tbbet ignyl tteleket
nem sikerlt bebizonytani. Az a tny, hogy egy program egy megolds megtallsra elvben alkalmas,
nem jelenti azt, hogy a program brmi olyan mechanizmust is tartalmaz, amely a megolds gyakorlati
megvalstshoz szksges.
A korltlan szmtsi kapacits illzija nem csak a problmamegold programokra korltozdott. A gpi
evolci (machine evolution), amelyet most genetikus algoritmusoknak (genetic algorithms) neveznk
(Friedberg, 1958; Friedberg s trsai, 1959), terletn vgzett korai ksrletek azon a ktsgtelenl helyes
feltevsen alapultak, amely szerint ha egy gpi kd programot megfelelen kicsi mutcik rvn vltoztatunk,
tetszleges, egyszer feladatot jl megold programhoz juthatunk el. Az tlet teht az volt, hogy vletlen
mutcikkal prblkozva, a program viselkedst javt mutcikat tartsuk meg. Azonban ezernyi ra gpid
ellenre sem sikerlt szinte semmilyen elrehaladst kimutatni. A korszer genetikus algoritmusok jobb
reprezentcikat hasznlnak, s tbb sikerre is vittk.
Az volt az MI ellen irnyul legfontosabb kritika a Lighthill-tanulmnyban (Lighthill, 1973), hogy nem kpes
lekzdeni a kombinatorikus robbanst. A tanulmny alapjn a brit kormny, kett kivtelvel az sszes
egyetemen minden MI-kutatsi tmogatst visszavont (a szbeszd kiss ms s sznesebb kpet fest a
nyomdafestket nem tr politikai ambcikrl s a szemlyes ellensgeskedsrl).
A harmadik nehzsg forrst az intelligens viselkeds generlshoz hasznlt alapvet struktrk
fundamentlis korltai jelentettk. Minsky s Papert Perceptrons c. knyve (Minsky s Papert, 1969) pldul azt
bizonytotta be, hogy br a perceptron (a neurlis hl egy egyszer formja) megtanulhat mindent, amit kpes
reprezentlni, vajmi keveset kpes reprezentlni. gy pldul a kt bemenet perceptront nem lehet megtantani
arra, hogy a bemeneteinek klnbzsgt felismerje. s br a szerzk eredmnyei bonyolultabb, tbbrteg
hlkra nem vonatkoztak, a neurlis hlk kutatsnak finanszrozsa rvidesen majdnem nullra esett vissza. A
sors irnija, hogy a tbbrteg neurlis hlk ksbbi, az 1980-as vekben trtn risi feltmadst hoz j
visszaterjesztses tanul algoritmust ppen 1969-ben fedeztk fel elszr (Bryson s Ho, 1969).
18
Created by XMLmind XSL-FO Converter.
Bevezets
Azzal, hogy felismerjk, hogy egy konkrt rszstruktra a molekula rsze, a lehetsges struktrajelltek szma
nagyon nagy mrtkben cskken. A DENDRAL-rendszer hatkony volt, mert:
Az ilyen problmk megoldshoz szksges sszes elmleti tudst sikerlt (a rendszer
spektrumjsl komponensben) lekpezni az ltalnos formrl (elsdleges ismeretek) egy
hatkony specilis formra (szakcsknyv).
(Feigenbaum s trsai, 1971)
A DENDRAL fontossga abban rejlik, hogy vitathatatlanul ez volt az els sikeres tudsintenzv rendszer.
Szakrtelmt a nagyszm specilis rendeltets szably biztostotta. A ksbbi rendszerekben szintn
megjelent a McCarthy-fle Advice Taker egyik f gondolata a (szablyformj) tuds s a kvetkeztet
komponens hatrozott elklntse.
Okulva az ilyen leckn, Feigenbaum s msok a Stanfordon belekezdtek a heurisztikus programozsi projektbe
(Heuristic Programming Project, HPP) azzal a cllal, hogy megvizsgljk, a szakrtrendszereknek (expert
systems) ez az j mdszertana milyen mrtkben alkalmazhat az emberi szakrtelem ms terletein. A
kvetkez komoly erfeszts az orvosi diagnzis terletn szletett meg. Feigenbaum, Buchanan s dr. Edward
Shortliffe vrrel kapcsolatos fertzsek diagnosztizlsra fejlesztettk ki a MYCIN-rendszert. 450 szablyval a
MYCIN elrte az egyes szakrtk hatkonysgt s a kezd orvosoknl lnyegesen jobb teljestmnyt nyjtott. A
MYCIN kt f vonatkozsban klnbztt a DENDRAL-tl. Elszr is, a DENDRAL szablyaival ellenttben, a
MYCIN-szablyok szrmaztatshoz nem ltezett semmilyen ltalnos elmleti modell. A szablyokat a
szakrtk kiterjedt kikrdezse rvn kellett beszerezni, akik viszont a szablyokat knyvekbl, ms
szakrtktl s kzvetlen tapasztalatokbl mertettk. A msik klnbsg abbl eredt, hogy a szablyoknak
tkrznik kellett az orvosi ismeret bizonytalansgt. A MYCIN-ben bizonyossgi tnyezknek (certainty
factors) (lsd 14. fejezet) nevezett bizonytalansgkezel mechanizmust alkalmaztak, amelyrl akkortjt gy
tnt, jl tkrzi a tnylls diagnzisra gyakorolt hatsnak orvosi megtlst.
A trgytartomny ismeretnek fontossga nyilvnval volt a termszetes nyelvfelismers terleten is. Br
Winograd termszetes nyelvfelismer rendszere, a SHRDLU igen lnk rdekldst keltett, a szintaktikai
elemzstl val fggsge nhny, a kezdeti gpi fordtsban mr tapasztalt problmhoz vezetett. A program
kpes volt a ktrtelmsgen fellkerekedni, s a nvmsi szerkezeteket megrteni. Ez azonban azrt volt
lehetsges, mert a programot kifejezetten egy adott trgytartomnyhoz a kockavilghoz fejlesztettk ki.
Nhny kutat, kztk Eugene Charniak, Winograd vgzs trsa az MIT-rl, felvetette, hogy a termszetes
nyelv robusztus felismerse a vilgrl szl ltalnos ismereteket s ezen ismeretek ltalnos felhasznlsi
mdszereit ignyli.
A Yale-en, Roger Schank, a nyelvssz lett MI-kutat, ezt a nzetet mg jobban hangslyozta, azt lltvn, hogy
olyan dolog, mint a szintaxis pedig nincs, ami ugyan sok nyelvszt felhbortott, de egyben egy hasznos
19
Created by XMLmind XSL-FO Converter.
Bevezets
eszmecsert is elindtott. Schank s hallgati a termszetes nyelvet felismer programok egsz sort ptettk
meg (Schank s Abelson, 1977; Wilensky, 1978; Schank s Riesbeck, 1981; Dyer, 1983). A hangslyt azonban
kevsb magra a nyelvre, sokkal inkbb a nyelv megrtshez szksges tuds reprezentlsra s a vele val
kvetkeztetsre helyeztk. E problmakrbe tartozott a sztereotip helyzetek reprezentlsa (Cullingford, 1981),
az emberi memria szervezsnek lersa (Rieger, 1976; Kolodner, 1983) s a clok, tervek megrtse
(Wilensky, 1983).
A vals alkalmazsok szles kr elterjedse a mkdkpes tudsreprezentcis smk irnti ignyek
nvekedshez vezetett. Szmos klnbz reprezentcis s kvetkeztet nyelvet fejlesztettek ki. Egyes
megoldsok a logikn alapultak pldul a Prolog nyelv, amely Eurpban, s a PLANNER nyelvcsald, amely
az Egyeslt llamokban lett npszer. Msok, a Minsky ltal bevezetett keretek (frames) (Minsky, 1975)
tlett kvetve, inkbb strukturlt megkzeltst vlasztottak. Egybegyjtttek bizonyos esemnytpusokra vagy
objektumokra jellemz tnyeket, majd azokat a biolgiai taxonmira hasonlt nagy taxonomikus
tpushierarchikba rendeztk.
20
Created by XMLmind XSL-FO Converter.
Bevezets
Vannak, akik ezeket a vltozsokat gy jellemeztk, mint az elegnsak (neats) gyzelmt a szakadtak (scruffies) felett. Az elegnsak
gy gondoljk, hogy az MI-elmleteknek szigor matematikai alapokon kell llniuk, mg a szakadtak inkbb sok tletet prblnnak ki,
programokat rnnak, s megnznk, mi mkdkpes ezekbl. Mindkt megkzelts fontos. Az elegancia fel trtn eltolds annak a
jele, hogy a terlet egy stabil s rett szintet rt el (ms krds persze, hogy ezt a stabilitst j szakadt gondolatok mennyire bolygatjk
fel).
17
21
Created by XMLmind XSL-FO Converter.
Bevezets
tartalmaz nhny normatv szakrtrendszert a felmerl hibk javtsra. Errl az elgondolsrl szl a 1316.
fejezet.
Hasonl szeld forradalom kvetkezett be a robotika, a gpi lts s a tudsreprezentcik terletn. A
problmk s bonyolultsguk jobb megrtse, a nvekv matematikai httrrel sszefondva, robusztusabb
mdszerekhez s megvalsthat kutatsi menetrendekhez vezetett. Sok esetben a formalizls s a
specilizlds felaprzdst eredmnyezett. Az olyan tmk, mint a lts s a robotika az MI f vonaltl
egyre jobban elszigeteldnek. Az MI-nek a racionlis gensben megtesteslt egysgest kpe egy olyan
megkzelts, amely e divergl terleteken jra egysget teremthet.
Bevezets
5. sszefoglals
Ebben a fejezetben definiltuk az MI-t s ttekintettk az MI fejldsnek kulturlis httert. A legfontosabb
gondolatok kzl nhny:
Az egyes emberek klnbz mdon vlekednek az MI-rl. A kt fontos felteend krds az, hogy: a
gondolkods vagy a viselkeds az, ami nt rdekli? Embereket akar modellezni, vagy egy idealizlt
megkzeltst vlaszt?
Ebben a knyvben azt a nzetet fogadjuk el, hogy az intelligencia lnyegben a racionlis cselekvssel
kapcsolatos. Egy intelligens gens, idelis esetben, az adott szituciban a legjobb cselekvshez folyamodik.
Az ilyen rtelemben vett intelligens gensek ptsi problmit fogjuk tanulmnyozni.
A filozfusok (i. e. 400-ig visszamenleg) tettk lehetv az MI kialakulst azltal, hogy felvetettk: az elme
bizonyos rtelemben gpszer, hogy valamilyen bels nyelvezetben kdolt tudsanyagon operl, s hogy a
gondolat a helyes cselekvs megvlasztsnak eszkze.
A matematikusok megadtk a logikailag biztos, valamint a bizonytalan valsznsgi lltsok
manipullsnak eszkzt. Megadtk annak az alapjait is, hogy megrtsk a szmtsokat s az
algoritmusokrl kvetkeztethessnk.
A kzgazdszok formalizltk a dntshozatal folyamatt, hogy a dntshoznak maximlis vrhat hasznot
biztostson.
A pszicholgusok megerstettk azt a gondolatot, hogy az ember s az llatok informciprocesszl
gpezetnek tekinthetk. A nyelvszek azt mutattk ki, hogy a nyelvhasznlat ezzel a modellel sszhangban
van.
A szmtgp-technika biztostotta az MI alkalmazst lehetv tev mtermket. Az MI-programok
nagyok, a mkdsk lehetetlen lenne a memrinak s a sebessgnek a szmtgpes ipar biztostotta
nagyfok fejldse nlkl.
Az ilyen s hasonl helyeken, ahol a knyv szerzje igazn csak angolul rtelmes szfordulatokkal illusztrlja a mondanivaljt, az zenet
rdekben meghagyjuk a szavak eredeti angol formjt. (A lektor)
18
23
Created by XMLmind XSL-FO Converter.
Bevezets
5.2. Feladatok
Az albbi gyakorlpldknak az a rendeltetse, hogy vitt stimulljanak. Nhny kzlk flves hzi
feladatnak is alkalmas. E feladatokat mr most megksrelhetik megoldani s ksbb, a knyv olvasst
befejezve, e prblkozsokat megismtelhetik.
1.1.
Sajt szavaival definilja: (a) az intelligencia, (b) a mestersges intelligencia, (c) az gens fogalmakat.
1.2.
Olvasnival. Olvassa el Turing eredeti cikkt az MI-rl (Turing, 1950). A cikkben Turing a clkitzsvel s az
intelligenciatesztjvel kapcsolatos potencilis kifogsokat trgyalja. Melyik kifogsnak van mg ma is slya?
rvnyesek-e a cfolatai? El tud kpzelni ms kifogsokat is, amelyek a cikk megrst kvet fejldsbl
addnak? Turing a cikkben azt jsolja, hogy 2000-ben egy szmtgpnek 30%-os eslye lesz, hogy teljestsen
24
Created by XMLmind XSL-FO Converter.
Bevezets
egy 5 perces Turing-tesztet egy nem kpzett krdezvel szemben. sszernek gondolja ezt? s mondjuk 50 v
mlva?
1.3.
Olvasnival. Minden vben Loebner-djjal jutalmazzk azt a programot, amely a Turing-teszt egy bizonyos
verzijt legjobban kpes teljesteni. Kutassa fel a Loebner-dj legjabb gyztest s szmoljon be rla. Milyen
technikkra tmaszkodik ez a megolds? Milyen hatssal lehet ez az MI jelenlegi helyzetre?
1.4.
A problmknak vannak olyan jl ismert osztlyai, amelyek egy szmtgp szmra kezelhetetlenl nehezek,
ms osztlyok viszont szmtgpen bizonythatan nem dnthetk el. Azt jelenti-e ez, hogy az MI lehetetlen?
1.5.
Tegyk fel, hogy Evans ANALOGY programjt gy fejlesztjk tovbb, hogy a standard IQ-tesztnl 200 pontot
rjen el. Lesz-e akkor egy olyan programunk, ami intelligensebb az embernl? Magyarzza meg a vlaszt!
1.6.
Hogyan lehetsges, hogy az nelemzs valakinek a sajt gondolatairl szl beszmolja pontatlan?
Tvedhetek arrl, amit gondolok? Vitassa meg!
1.7.
Olvasnival.
Tanulmnyozza az MI-irodalmat, hogy eldnthesse, az albbi feladatokat jelenleg meg lehet-e oldani
szmtgpen:
a) Egy sznvonalas tenisz- (pingpong-) jtszma.
b) Autvezets Kair kzpontjban.
c) Heti lelmiszer-vsrls a piacon.
d) Heti lelmiszer-vsrls a vilghln.
e) Elfogadhat bridzsparti versenyszinten.
f) j matematikai ttelek felfedezse s bizonytsa.
g) Szndkosan humoros trtnet rsa.
h) Kompetens jogi tancsads egy specializlt jogi terleten.
i) Beszlt angol nyelv vals idben trtn fordtsa beszlt svd nyelvre.
j) Egy bonyolult sebszeti beavatkozs levezetse.
A ma mg nem megvalsthat feladatok esetn prblja azonostani a nehzsgeket, s megbecslni, hogy
mikorra tervezhet azok megoldsa.
1.8.
Nhny szerz azt lltotta, hogy az rzkels s a motorikus kpessgek az intelligencia legfontosabb
komponensei, s hogy a magasabb szint kpessgek szksgszeren parazita jellegek adalkok az alattuk
lev kpessgekhez. Nyilvnval, hogy az evolci zme s az agy nagy rsze az rzkelssel s a motorikus
kpessgekkel foglalkozik. Az MI pedig a jtk vagy logikai kvetkeztets jelleg feladatokat a vals vilgban
val rzkelsnl s cselekvsnl sok szempontbl knnyebbnek tallta. Nem gondolja-e, hogy az MI-nek a
magasabb szint kognitv kpessgekre irnyul hagyomnyos sszpontostsa tves clkitzs?
1.9.
Az evolci mirt eredmnyezett racionlisan cselekv rendszereket? Milyen clokat hivatottak az ilyen
rendszerek teljesteni?
1.10.
25
Created by XMLmind XSL-FO Converter.
Bevezets
Racionlisak-e a reflexszer cselekvsek (mint pldul a forr tzhelytl elrntani a kezet)? Intelligensek-e?
1.11.
Egy szmtgp nem lehet intelligens csak azt teszi, amit a programoz mond neki. Igaz-e az llts msodik
rsze, s vajon impliklja-e az elst?
1.12.
Az llatok nem lehetnek intelligensek csak azt teszik, amit a gnjeik mondanak nekik. Igaz-e az llts
msodik rsze, s vajon impliklja-e az elst?
1.13.
Az llatok, az emberek s a szmtgpek nem lehetnek intelligensek csak azt teszik, amit a rszket alkot
atomoknak a fizika trvnyei parancsolnak. Igaz-e az llts msodik rsze, s vajon impliklja-e az elst?
26
Created by XMLmind XSL-FO Converter.
1. Bevezets
Egy gens (agent) brmi lehet, amit gy tekinthetnk, mint ami az rzkeli (sensors) segtsgvel rzkeli a
krnyezett (environment), s beavatkozi (actuators) segtsgvel megvltoztatja azt. A 2.1. bra ezt az
egyszer elkpzelst szemllteti. Az emberi gensnek van szeme, fle s egyb szervei az rzkelsre, s keze,
lba, szja s egyb testrszei a beavatkozsra. A robotgens kamerkat s infravrs tvolsgi keresket
hasznl rzkelknt, s klnfle motorokat beavatkozknt. A szoftvergens billentyletseket,
fjltartalmakat s hlzati adatcsomagokat fogad rzkelinek bemeneteknt, s kpernyn trtn kijelzssel,
fjlok rsval, hlzati csomagok kldsvel avatkozik be a krnyezetbe. Azzal az ltalnos felttelezssel
fogunk lni, hogy minden gens kpes sajt akciinak rzkelsre (de nem mindig ltja azok hatst).
27
Created by XMLmind XSL-FO Converter.
Intelligens gensek
Fontos
Az rzkels (percept) fogalmat hasznljuk az gens rzkel bemeneteinek lersra egy tetszleges
pillanatban. Egy gens rzkelsi sorozata (percept sequence) az gens rzkelseinek teljes
trtnete, minden, amit az gens valaha is rzkelt. ltalnossgban, egy adott pillanatban egy gens
cselekvse az addig megfigyelt teljes rzkelsi sorozattl fgghet. Ha az sszes lehetsges rzkelsi
sorozathoz meg tudjuk hatrozni az gens lehetsges cselekvseit, akkor lnyegben mindent
elmondtunk az gensrl. Matematikailag megfogalmazva azt mondhatjuk, hogy az gens viselkedst
az gensfggvny (agent function) rja le, ami az adott rzkelsi sorozatot egy cselekvsre kpezi le.
Elkpzelhetjk tblzatos formban az gensfggvnyt, amely forma mindenfle genst ler; az gensek
tbbsgre ez igen nagy tblzatot jelentene valjban vgtelen nagyot, hacsak nem korltozzuk a figyelembe
veend rzkelsi sorozatok hosszt. Ha adott egy gens, amivel ksrletezhetnk, akkor elmletileg
megalkothatjuk ezt a tblzatot az sszes lehetsges rzkelsi sorozat kiprblsval s az gens vlaszul
vgrehajtott cselekvseinek feljegyzsvel.1 Termszetesen a tblzat az gens kls jellemzse. Egy
mestersges gens belsejben az gensfggvnyt egy gensprogram (agent program) valstja meg. Fontos,
hogy megklnbztessk e kt dolgot. Az gensfggvny egy absztrakt matematikai lers, az gensprogram
egy konkrt implementci, amely az gens architektrjn mkdik.
Ezen tletek illusztrlsra egy igen egyszer pldt fogunk hasznlni a 2.2. brn lthat porszvvilgot. A
vilg annyira egyszer, hogy mindent le tudunk rni, ami megtrtnik, tovbb ez egy kitallt vilg, gy sokfle
varicit kitallhatunk. A vilgban csak kt helyszn van: az A s B ngyzetek. A porszvgens szleli, hogy
melyik ngyzetben van, valamint azt, hogy van-e ott piszok, vagy nincs. Lehetsges akcii: mozoghat balra
vagy jobbra, felszvhatja a port, valamint nem csinl semmit. Egy egyszer gensfggvny a kvetkez: ha az
aktulis ngyzet koszos, szvd fel a koszt, egybknt menj t a msik ngyzetbe. Ezen gensfggvny
tblzatnak egy rszlete a 2.3. brn lthat. Egy, az gensfggvnyt megvalst egyszer gensprogramot a
fejezet ksbbi rszben, a 2.8. brn mutatunk be.
2.3. bra - A 2.2. brn szerepl porszvvilg egy egyszer gensfggvnye rszleges
tblzatos formban
Amennyiben az gens cselekvsnek kivlasztsban a vletlennek is szerepe van, gy minden sorozatot tbbszr kellene kiprblnunk,
hogy az egyes cselekvsek valsznsgeit meghatrozhassuk. Ltszlag gy tnhet, hogy vletlenszeren cselekedni botorsg, a
ksbbiekben azonban ltni fogjuk, hogy ez lehet nagyon intelligens viselkeds is.
1
28
Created by XMLmind XSL-FO Converter.
Intelligens gensek
Fontos
A 2.3. brra nzve lthatjuk, hogy sokfle porszvvilg-beli gens definilhat egyszeren a jobb
oldali oszlop klnbz kitltsvel. Ezek utn a nyilvnval krds a kvetkez: Mi a tblzat helyes
kitltsnek mdja? Ms szavakkal, mitl lesz egy gens j vagy rossz, intelligens vagy buta. Ezeket a
krdseket a kvetkez rszben fogjuk megvlaszolni.
Mieltt lezrnnk ezt a rszt, fontos megjegyeznnk, hogy az gens fogalom bevezetsnek a clja nem a vilg
gensekre s nem gensekre trtn felosztsa, hanem egy olyan eszkz megteremtse, amivel rendszereket
elemezhetnk. Egy kzi szmolgp is tekinthet gensnek, amely azt a cselekvst vlasztja, hogy 4-et r a
kijelzjre, ha 2 + 2 = rzkelsi sorozatot kap, de egy ilyen felfogs aligha segt minket a szmolgp
megrtsben.
2.1. Teljestmnymrtkek
A teljestmnymrtk (performance measure) testesti meg az gens sikeressgnek kritriumt. Ha egy
genst elhelyeznk a krnyezetben, akkor cselekvsek sorozatval vlaszol az rzkelseire. A cselekvsek
sorozatnak hatsra a krnyezet llapotok sorozatn halad vgig. Ha ez a sorozat kvnatos, akkor az gens jl
teljestett. Nyilvnvalan nincs egyetlen olyan rgztett mrtk, amely minden gens szmra megfelel lenne.
Megkrdezhetjk az gens szubjektv vlemnyt, hogy mennyire rzi magt elgedettnek a sajt
teljestmnyvel, de egyes gensek kptelenek lesznek vlaszolni, mg msok becsapjk magukat.2 Ezrt
valamilyen objektv teljestmnymrtkhez fogunk ragaszkodni, tipikusan egy olyanhoz, amit az gens tervezje
hatrozott meg.
Fontos
Pldaknt tekintsnk az elz rszben megismert porszv genst. Teljestmnymrtkknt
javasolhatjuk az egy nyolcrs mszakban feltakartott por mennyisgt. Egy racionlis genssel,
termszetesen, az ember azt kapja, amit kr. Azaz a racionlis gens azzal maximalizlhatja ezt a
teljestmnymrtket, hogy feltakarts utn kinti a szemetet, majd jra feltakartja s gy tovbb. Egy
finomtott mrtk a tiszta padl elrst djazn. Pldul minden tiszta ngyzet egy pontot rhet minden
idlpsben (taln valamilyen levonssal figyelembe vve az elfogyasztott elektromos energit, illetve
Az emberi gensekre klnsen jellemz a savany a szl effektus azaz hogy nem is akarjk igazn azt, amit nem sikerlt
megkapniuk, mint pldul: Nos, sebaj, nem is akartam annyira azt a buta Nobel-djat.
2
29
Created by XMLmind XSL-FO Converter.
Intelligens gensek
a keltett zaj mennyisgt is). ltalnos szablyknt megfogalmazhat, hogy a teljestmnymrtket jobb
aszerint megllaptani, hogy mit akarunk elrni a krnyezetben, mint aszerint, hogy mikpp kellene az
gensnek viselkednie.
A teljestmnymrtk kivlasztsa nem mindig knny. Pldul a tiszta padl elz paragrafusbeli fogalma a
tisztasg idtlagn alapul. Mg ugyanaz az tlagos tisztasg is elrhet kt klnbz genssel, az egyik
kzepes aktivitssal dolgozik llandan, mg a msik energikusan rvid ideig, aztn hossz szneteket tart.
Hogy melyik a javasolt mdszer, az ltszlag a hzvezets tudomnynak krdse, valjban egy mly filozfiai
krds, messzibe mutat kvetkezmnyekkel. Mi a jobb: a tlzsok vakmer vilga vagy a biztonsgos, de
unalmas ltezs? Mi a jobb: egy gazdasg, ahol mindenki egyformn mrskelten szegny, vagy egy msik,
ahol vannak nagyon gazdagok s nagyon szegnyek? Ezen krdsek megvlaszolst hzi feladatknt bzzuk a
szorgalmas olvasra.
2.2. Racionalits
Ngy dolgon mlik az, hogy egy adott pillanatban mi racionlis. Ezek:
A siker fokt mr teljestmnymrtk.
Az gens eddigi tudsa a krnyezetrl.
A cselekvsek, amiket az gens kpes vgrehajtani.
Az gens rzkelsi sorozata az adott pillanatig.
Fontos
Ez elvezet a racionlis gens (rational agent) defincijhoz:
Az idelis racionlis gens minden egyes szlelsi sorozathoz a benne tallhat tnyek s a beptett
tudsa alapjn minden elvrhat dolgot megtesz a teljestmnymrtk maximalizlsrt.
Vizsgljuk meg az egyszer porszvgenst, amelyik megtiszttja a ngyzetet, ha az koszos, s tmegy a
szomszdos ngyzetbe, ha nem az! Az gensfggvnyt tblzatosan a 2.3. bra adja meg. Ez egy racionlis
gens? Attl fgg! Elszr is, meg kell mondanunk mi a teljestmnymrtk, mit tudunk a krnyezetrl, s
milyen rzkeli s beavatkozi vannak az gensnek. Tegyk fel a kvetkezket:
A teljestmnymrtk egy ponttal jutalmaz minden tiszta ngyzetet minden idpillanatban egy 1000
idpillanatbl ll lettartam alatt.
A krnyezet geogrfija a priori ismert (2.2. bra), de a piszok eloszlsa s az gens kezdeti pozcija nem.
A tiszta ngyzetek tisztk maradnak, a felszvs pedig megtiszttja az aktulis ngyzetet. A Balra s Jobbra
cselekvsek balra s jobbra mozgatjk az genst, kivve ha ezzel kikerlne a krnyezetbl, mely esetben az
gens nem mozdul.
A kvetkez cselekvsek lteznek: Balra, Jobbra, Szv s Semmittevs (azaz nem tesz semmit sem).
Az gens helyesen szleli jelenlegi helyzett s azt, hogy van-e ott kosz.
Azt lltjuk, hogy ezen felttelek mellett az gens igenis racionlis: a vrhat teljestmnye legalbb annyira j,
mint brmely ms gens. A 2.4. feladatban azt krjk majd, hogy ezt az lltst bizonytsa be.
Knnyen belthat, hogy ugyanez az gens ms krlmnyek kztt irracionlis lenne. Pldul ha minden koszt
feltakartott, akkor szksgtelenl oszcilllni fog ide-oda; ha a teljestmnymrtk tartalmaz egy bntetpontot
minden balra vagy jobbra trtn mozgsrt, akkor az gens egszen gyengn teljest. Egy jobb gens abban az
esetben, ha meggyzdtt arrl, hogy az sszes ngyzet tiszta, nem csinlna semmit. Ha a tiszta ngyzetek ismt
koszoss vlhatnak, az gensnek idnknt ellenriznie kellene ket, s kitakartania, ha szksges. Ha a
krnyezet geogrfija ismeretlen, az gensnek fel kell trkpeznie ahelyett, hogy az A s B ngyzetekhez kti
magt. A 2.4. feladatban azt krjk majd, hogy tervezzen ezekre az esetekre genseket.
30
Created by XMLmind XSL-FO Converter.
Intelligens gensek
Fontos
Addig a szintig, mg az gens a tervezi ltal beptett tudsra pt s nem sajt megfigyelseire, azt
mondjuk, hogy az gens nem autonm (autonom). Egy racionlis gensnek autonmnak kell lennie
mindent, amit csak megtanulhat, meg kell tanulnia ahhoz, hogy a hinyos vagy hibs elzetes tudst
kompenzlja. Pldul az a porszvgens, amelyik megtanulja elreltni, hogy hol s mikor tnik fel
3
Lsd N. Henderson: Srgsen j ajtzrakat a Boeing 747 jumbo jetek szmra. Washington Post, 1989. augusztus 24.
31
Created by XMLmind XSL-FO Converter.
Intelligens gensek
tovbbi szemt, jobban fog dolgozni, mint amelyik nem. Praktikus okbl ritkn kell teljes autonmit
biztostani mr a kezdetektl: amikor egy gensnek nincs tapasztalata, vagy csak kevs van, akkor
vletlenszeren kellene cselekednie, hacsak a tervezje nem ad valamilyen segtsget. gy, mint ahogy
az evolci elltja az llatokat elegend beptett reflexszel a tllshez addig, mg sajt maguk is
megtanuljk mindazt, ami a tllshez szksges, a mestersges intelligens gensek kezd tudssal s
tanulsi kpessggel val elltsa is sszer lenne. Miutn elegend tapasztalatot szerzett a
krnyezetrl, a racionlis gens viselkedse gyakorlatilag fggetlenn vlhat a beptett elzetes
tudstl. Ily mdon a tanuls alkalmazsval olyan gens tervezhet, amely sokfle krnyezetben is
sikeres lesz.
3. A Krnyezetek termszete
Most, hogy mr rendelkeznk a racionalits defincijval, mr majdnem kszen llunk arra, hogy racionlis
gensek ptsrl gondolkodjunk. Elszr azonban meg kell vizsglnunk a feladatkrnyezeteket (task
environments), amelyek lnyegben a problmk, amelyekre a racionlis gensek jelentik a megoldsokat.
Elszr azt mutatjuk meg, hogyan kell a feladatkrnyezetet meghatrozni, tbb pldval illusztrlva a
folyamatot. Ezek utn megmutatjuk, hogy tbbfle feladatkrnyezet ltezik. A krnyezet tpusa kzvetlenl
befolysolja az gensprogram megfelel tervezst.
A porszvvilg egyszer plda volt, vegynk most egy bonyolultabbat: az automatizlt taxisofr pldjt. Ezt a
pldt fogjuk a fejezet htralev rszben hasznlni. Ki kell emelnnk, mieltt az olvas megrmlne, hogy a
teljesen automata taxisofr jelenleg valamelyest tlmutat a ltez technolgia lehetsgein. (A 4. szakasz - A
mestersges intelligencia jelenlegi helyzete tallhat egy ltez sofr robot lersa, de az Intelligent
Transportation Systems konferencia legutbbi kiadvnyait is rdemes megnzni.) A teljes autvezetsi feladat
rendkvl nyitott vg. Nincs hatra a lehetsgesen felbukkan krlmnyek jszer kombinciinak egy
msik ok arra, hogy ezt vlasszuk vizsglatunk trgyul. A 2.4. bra sszefoglalja a taxi feladatkrnyezetnek
TKB-lerst. A kvetkezkben rszletesen trgyaljuk az egyes elemeket.
Elsknt: mi az a teljestmnymrtk, amit az automata taxisofrnk el lltunk? Elvrt jellemzk a helyes
cllloms elrse; az zemanyag-fogyaszts s az elhasznlds minimalizlsa; az t kltsgnek s/vagy
idejnek minimalizlsa; a kzlekedsi szablyok megszegsnek s ms vezetk megzavarsnak
minimalizlsa; a biztonsg s utasknyelem maximalizlsa; a haszon maximalizlsa. Nyilvnvalan ezen
clok egy rsze konfliktusban van egymssal, kompromisszumokra lesz szksg.
A kvetkez: mi a taxi vezetsi krnyezete? Minden taxisofrnek tbb tpus ttal kell szembenznie, a vidki
s vrosi utaktl egszen a tizenkt svos autplykig. Az utak ms forgalommal, gyalogosokkal, kbor
32
Created by XMLmind XSL-FO Converter.
Intelligens gensek
Ezzel ellenttben bizonyos szoftvergensek (vagy szoftverrobotok, azaz szoftbotok) rszletgazdag, korltok
nlkli krnyezetekben lteznek. Kpzeljnk el egy szoftbotot, amelyik egy nagy utasszllt gp
szimultorval repl. A szimultor egy rszletgazdag, komplex krnyezet, amelyben ms replgpekkel
kapcsolatos s fldi mveletek is vannak, s a szoftvergensnek vals idben kell vlasztania az akcik szles
vlasztkbl. Vagy kpzeljnk el egy szoftbotot, amelyet internetes hrforrsok figyelsre terveztek, s az
33
Created by XMLmind XSL-FO Converter.
Intelligens gensek
rdekes hreket megmutatja az gyfeleinek. A helyes mkdshez szksge lesz valamilyen termszetes nyelv
feldolgozsi kpessgre, meg kell tanulnia, hogy melyik gyfelt mi rdekli, s szksge lesz a tervei dinamikus
megvltoztatsra pldul amikor az egyik hrforrshoz megsznik a kapcsolata vagy amikor egy j forrs
ltesl. Az internet egy olyan krnyezet, amelynek komplexitsa versenyez a fizikai vilgval, s amelynek
laki kztt sok mestersges gens van.
34
Created by XMLmind XSL-FO Converter.
Intelligens gensek
nem tesz semmit. Ha a krnyezet nem vltozik az id elrehaladtval, de az gens teljestmnymrtke igen,
akkor azt mondjuk, hogy a krnyezet szemidinamikus (semidynamic). A taxivezets nyilvnvalan
dinamikus: a tbbi aut s a taxi tovbbhalad, mikzben a vezetsi algoritmus azon bizonytalankodik, hogy
mit is tegyen. Az rval jtszott sakk szemidinamikus. A keresztrejtvnyek statikusak.
Diszkrt (discrete) vagy folytonos (continuous). A diszkrt/folytonos feloszts alkalmazhat a krnyezet
llapotra, az idkezels mdjra, az gens szlelseire, valamint cselekvseire. Pldul egy diszkrt llapot
krnyezet, mint amilyen a sakkjtk, vges szm klnll llapottal rendelkezik. A sakkban szintn
diszkrt az akcik s cselekvsek halmaza. A taxivezets folytonos llapot s idej problma: a sebessg, a
taxi s ms jrmvek helye folytonos rtkek egy tartomnyt jrja vgig a folytonos idben. A taxivezets
akcii szintn folytonosak (pldul kanyarodsi szgek stb.). Szigoran vve a digitlis kamerktl rkez
bemenet diszkrt, de tipikusan gy kezeljk, mint amely folyamatosan vltoz mennyisgeket s helyeket
reprezentl.
Egygenses (single agent) vagy tbbgenses (multiagent). Az egygenses s tbbgenses krnyezetek
kztti klnbsgttel egyszernek tnhet. Pldul a keresztrejtvnyt megfejt gens nmagban
nyilvnvalan egygenses krnyezetben van, mg egy sakkoz gens egy ktgensesben. Vannak azonban
knyes krdsek. Elszr is: lertuk azt, hogy egy entits hogyan tekinthet gensnek, ugyanakkor nem
magyarztuk meg, mely entitsok tekintendk gensnek. Egy A gensnek (pldul a taxisofrnek) egy B
objektumot (egy msik jrmvet) gensnek kell tekintenie, vagy egyszeren egy sztochasztikusan viselked
dolognak, a tengerparti hullmokhoz vagy a szlben szll falevelekhez hasonlatosan? A vlaszts kulcsa az,
hogy vajon B viselkedse legjobban egy A viselkedstl fgg teljestmnymrtk maximalizlsval rhate le. Pldul a sakkban a B ellenfl sajt teljestmnymrtkt prblja maximalizlni, amely a sakk
szablyainak kvetkeztben A teljestmnymrtkt minimalizlja. gy a sakk egy verseng (competitive)
tbbgenses krnyezet. Msrszrl, a taxi vezetsi krnyezetben az tkzsek elkerlse az sszes gens
teljestmnymrtkt maximlja, gy az rszben kooperatv (cooperative) tbbgenses krnyezet. Emellett
rszben verseng is, hiszen pldul csak egy aut tud egy parkolhelyet elfoglalni. A tbbgenses
krnyezetekben felmerl genstervezsi problmk gyakran egszen msok, mint egygenses
krnyezetekben. Tbbgenses krnyezetekben pldul a kommunikci (communication) gyakran
racionlis viselkedsknt bukkan fel; egyes rszlegesen megfigyelhet verseng krnyezetekben a
sztochasztikus viselkeds racionlis, hiszen gy elkerlhetk a megjsolhatsg csapdi.
Ahogy vrhat, a legnehezebb a rszlegesen megfigyelhet, sztochasztikus, sorozatszer, dinamikus, folytonos
s tbbgenses eset. Az is kiderl, hogy a vals helyzetek legtbbje olyan bonyolult, hogy valdi
determinisztikussguk vitatott krds; gyakorlati okokbl sztochasztikusknt kezelendk. A taxivezets
mindezen szempontok szerint nehz.
A 2.6. bra ismers krnyezetek tulajdonsgait sorolja fel. Vegyk szre, hogy a vlaszok nem mindig
egyrtelmek. Pldul a sakkot teljesen megfigyelhetnek tntettk fel; szigoran vve ez hibs, mivel a
roslsra, menet kzbeni tsre s ismtlses dntetlenre vonatkoz egyes szablyok megkvetelik a jtk
menetvel kapcsolatos adatok megjegyzst, amelyek a tblzat llapotnak rszeknt nem figyelhetk meg. A
megfigyelhetsg ezen kivtelei persze cseklyek egy taxivezet, egy angol nyelvtanr vagy egy orvosi
diagnosztikai rendszerhez kpest.
A tblzatban bizonyos tovbbi vlaszok a feladatkrnyezet definilstl fggnek. Az orvosi diagnosztikai
feladatot egygensesnek tntettk fel, mivel a betegben zajl betegsgi folyamat eredmnyesen nem
modellezhet gensknt, de egy orvosi diagnosztikai rendszernek szksg esetn trdnie kell ellenszegl
betegekkel s szkeptikus munkatrsakkal, gy a krnyezetnek lehet tbbgenses aspektusa. Tovbb az orvosi
diagnosztika epizdszer, ha valaki a feladatot gy tekinti, mint a tnetek listja alapjn trtn diagnzis
kivlasztst; a problma sorozatszer, ha a feladat tartalmazhat egy vizsglatsorozat-javaslatot, az eredmnyek
kirtkelst a kezels folyamn s gy tovbb. Tovbb sok krnyezet epizdszer az gensek egyni akciinl
magasabb szinteken. Pldul egy sakktorna jtszmk sorozatt tartalmazza, minden jtk egy epizd, mivel
(nagyjbl) az gens adott jtszmabeli lpseinek hozzjrulsa az gens teljestmnyhez nem fgg a korbbi
jtszmkban vlasztott lpseitl. Msrszrl, az egy jtszmn belli dntshozatal biztosan sorozatszer.
35
Created by XMLmind XSL-FO Converter.
Intelligens gensek
Nyilvnvalan a kivlasztott programunknak olyannak kell lennie, ami megfelel az architektra szmra. Ha a
program pldul Stl jelleg akcikat fog javasolni, akkor jobb, ha az architektrnak vannak lbai. Az
architektra lehet egyszer szmtgp, vagy lehet egy robotaut szmos fedlzeti szmtgppel, kamerval s
ms rzkelkkel. ltalnossgban az architektra a szenzoroktl rkez szlelseket elrhetv teszi a program
szmra, futtatja a programot, s cselekvseit ltrejttk pillanatban a beavatkozk fel tovbbtja. E knyv
tlnyom rsze az gensprogramok tervezsrl szl, br a 24. s 25. fejezet kifejezetten az rzkelkkel s a
beavatkozkkal foglalkozik.
4.1. gensprogramok
36
Created by XMLmind XSL-FO Converter.
Intelligens gensek
Pldartk annak megfontolsa, hogy az gensek tervezsnek tblzatvezrelt megkzeltse mirt van
kudarcra tlve. Legyen P a lehetsges szlelsek halmaza s T az gens lettartama (az ltala vett szlelsek
teljes szma). A tblzat
elemet fog tartalmazni. Vegyk pldaknt az automata taxit: az egyetlen
kamertl rkez vizulis bemenet krlbell 27 megabjt/msodperc sebessggel rkezik (30 kocka
msodpercenknt, 640 x 480 kppont 24 bit szninformcival). Ez alapjn egyrnyi vezetshez olyan
tblzatot kapunk, amely tbb mint 10250 000 000 000 bejegyzst tartalmaz. Mg a sakkhoz tartoz tblzat is amely
a val vilg egy kicsiny, jl viselked rszlete legalbb 10150 bejegyzst tartalmazna. Ezen tblzatok ijeszt
mrete (a megfigyelhet vilgegyetemben az atomok szma kevesebb mint 10 80) azt jelenti, hogy (a) ebben az
univerzumban egyetlen fizikai gensnek sem lesz elg helye a tblzat trolsra, (b) a terveznek nem lenne
elg ideje a tblzat elksztshez, (c) egyetlen gens sem lenne kpes a tblzat helyes bejegyzseit
megtanulni sajt tapasztalatbl, s (d) mg ha a krnyezet elgg egyszer is egy megvalsthat mret
tblzathoz, a terveznek mg akkor sincs segtsge ahhoz, hogyan tltse ki a tblzat bejegyzseit.
Mindezek ellenre, a TBLZAT-VEZRLS-GENS megteszi azt, amit akarunk: megvalstja a kvnt
gensfggvnyt. Az MI alapvet kihvsa, hogy hogyan rjunk olyan programot, amely a lehetsgek hatrain
bell nagyszm tblzatbejegyzsek helyett kismret programkddal produkl racionlis viselkedst. Sok
pldnk van arra, hogy ez ms terleteken megvalsthat: pldul az 1970-es vek eltt a mrnkk s az
iskols gyerekek ltal hasznlt hatalmas ngyzetgyktblzatokat ma mr egy elektronikus kalkultorokon fut
tsoros program vltotta fel, amely a Newton-mdszert alkalmazza. A krds az, hogy megteheti-e az MI azt az
ltalnos intelligens viselkedsre, amit Newton tett meg a ngyzetgykkre? Abban hisznk, hogy a vlasz igen.
E fejezet htralev rszben ngy alapvet gensprogramtpust vzolunk, amely megtestesti a szinte minden
intelligens rendszer mgtt meghzd alapelveket:
Egyszer reflexszer gensek.
Modellalap reflexszer gensek.
Vannak ms lehetsgek is az gensvz szmra, pldul lerhatjuk az gensprogramot korutinok (coroutines) formjban, amelyek a
krnyezethez kpest aszinkron mdon futnak. Minden ilyen korutin rendelkezik egy bemeneti s egy kimeneti porttal, s egy olyan ciklust
tartalmaz, amelyik beolvassa a bemeneti portrl az szlelseket, s kirja a cselekvseket a kimeneti portra.
6
37
Created by XMLmind XSL-FO Converter.
Intelligens gensek
Clorientlt gensek.
Hasznossgorientlt gensek.
Ezek utn ltalnossgban elmagyarzzuk, hogyan alakthatjuk t ezeket tanul gensekk.
Kpzeljk magunkat az automata taxisofr helybe! Ha az elttnk halad aut fkez, s a fklmpi
kigyulladnak, akkor szre kell vennnk, s el kell kezdennk fkezni. Ms szavakkal, valamilyen feldolgozs
zajlik a kpi bemeneten, hogy megllaptsunk egy felttelt, amit az elz aut fkez-nek hvunk; azutn ez
kivlt valamilyen kialaktott kapcsolatot az gens programjban a kezdj fkezni cselekvshez. Ezt a
kapcsolatot felttelcselekvs szablynak (conditionaction rule)7 hvjuk, s
ha az-elz-aut-fkez akkor kezdj-fkezni
formban rjuk. Az embereknek sok hasonl kapcsolatuk van, egy rszk tanult vlasz (ami a vezetst illeti),
mg ms rszk felttlen reflex (mint pldul a pislogs, amikor valami megkzelti a szemnket). A
ksbbiekben tbb klnbz mdot is ltni fogunk arra, hogy ilyen kapcsolatok hogyan tanulhatk s
valsthatk meg.
A 2.8. bra programja egy egyedi porszvkrnyezetre specifikus. Egy ltalnosabb s rugalmasabb
megkzelts az, hogy elszr egy ltalnos cl rtelmezt ptnk felttelcselekvs szablyokra, majd
szablyhalmazokat hozunk ltre specifikus feladatkrnyezetek szmra. A 2.9. bra ezen ltalnos program
struktrjt adja meg sematikus formban, megmutatva, hogy a felttelcselekvs szablyok hogyan teszik
lehetv az gens szmra az szlelsek s cselekvsek sszektst. (Ne aggdjon, ha ez tl egyszernek tnik:
hamarosan sokkal rdekesebb vlik.) Az gens dntsi folyamatnak aktulis bels llapott ngyszgekkel
jelljk, a folyamatban felhasznlt httrtuds reprezentlsra pedig ovlisokat hasznlunk. Az gensprogram,
amely szintn igen egyszer, a 2.10. brn lthat. A BEMENET-FELDOLGOZS fggvny a bemenetbl lltja el
az aktulis llapot absztrakt lerst, a SZABLY-ILLESZTS fggvny pedig az els olyan szablyt adja vissza a
szablyok halmazbl, amely illeszkedik az adott llapot lersra. Vegyk szre, hogy a szablyok s az
illeszkeds fogalmakkal trtn lers tisztn koncepcionlis egyedi megvalstsok akr egy logikai
ramkrt megvalst logikai kapu halmazbl is llhatnak.
A kapcsolatot szitucicselekvs (situationaction rule), produkcis (production rule) vagy haakkor szablynak (ifthen rule) is
nevezik.
7
38
Created by XMLmind XSL-FO Converter.
Intelligens gensek
Fontos
Az egyszer reflexszer genseknek megvan az az rtkelend tulajdonsga, hogy egyszerek,
ugyanakkor igen korltozott intelligencijnak bizonyulnak. A 2.10. brn lthat gens csak akkor fog
mkdni, ha a helyes dnts kizrlag az aktulis szlels alapjn meghozhat azaz akkor, ha a
krnyezet teljesen megfigyelhet. Mr a megfigyelhetsg legkisebb hinya is komoly problmt
okozhat. Pldul a korbban bemutatott fkezsi szably felttelezi, hogy az elz-aut-fkez felttel
megllapthat az aktulis szlelsbl az aktulis videokpbl amennyiben az elz autnak
kzpre szerelt fklmpja van. Sajnlatos mdon, a rgebbi modelleken klnbzkppen
helyezkednek el a hts helyzetjelzk, a fklmpk s az indexlmpk, gy egyetlen kp alapjn nem
mindig lehetsges azt megllaptani, hogy az aut fkez-e. Egy egyszer reflexszer gens, amely egy
ilyen aut mgtt halad, vagy folyamatosan szksgtelenl fkezne, vagy ami mg rosszabb, sosem
fkezne.
2.10. bra - Egy egyszer reflexszer gens. A jelenlegi szitucira (amit az szlels
hatroz meg) illeszked felttel szably megkeressvel, majd a hozz tartoz cselekvs
vgrehajtsval mkdik.
Hasonl problmt lthatunk felbukkanni a porszvvilgban. Tegyk fel, hogy egy egyszer reflexszer genst
megfosztunk a helyzetrzkel szenzortl, s csak piszokrzkelje van. Egy ilyen gensnek csak kt szlelse
van: [Koszos] s [Tiszta]. Felszvhat vlaszul a [Koszos]-ra; de mit tegyen, ha [Tiszta] az szlels? A Balra
mozgs (mindrkre) sikertelen lesz, ha pldul az A ngyzetben kezd, a Jobbra mozgs pedig (mindrkre)
sikertelen, ha pldul a B ngyzetben kezd. A vgtelen ciklusok gyakran elkerlhetetlenek rszlegesen
megfigyelhet krnyezetben mkd egyszer reflexszer gensek szmra.
39
Created by XMLmind XSL-FO Converter.
Intelligens gensek
2.12. bra - A modellalap reflexszer gens. Nyomon kveti a vilg jelenlegi llapott
egy bels modellben. Ezek utn a reflexszer genshez hasonlan vlaszt egy cselekvst.
40
Created by XMLmind XSL-FO Converter.
Intelligens gensek
Ezen bels llapot frisstse az id elrehaladtval ktfle tuds beptst ignyli az gensprogramba. Elszr
is szksgnk van olyan informcira, hogy a vilg hogyan alakul az genstl fggetlenl pldul egy elz
aut ltalban kzelebb lesz most, mint egy pillanattal azeltt. Msodszor, szksgnk van valamilyen
informcira arrl, hogy az gens sajt cselekvsei hogyan vltoztatjk meg a vilgot pldul amikor az gens
a kormnyt az ramutat jrsnak megfelelen tekeri, az aut jobbra fordul, vagy t percig szaknak tart
vezets utn egy autplyn ltalban krlbell t mrflddel lesz szakabbra, mint ahol t perce volt. Ezt, a
vilg mkdsnek mikntjrl szl tudst akr egyszer logikai ramkrkkel, akr teljes tudomnyos
elmletekkel valstjuk meg a vilg modelljnek (model) hvjuk. Egy ilyen modellt hasznl genst pedig
modellalap gensnek (model-based agent).
A 2.11. bra szemllteti a bels llapottal rendelkez reflexszer gens struktrjt, megmutatva azt, ahogyan a
jelenlegi szlels a rgi bels llapottal kombinldva ltrehozza a jelenlegi llapot frisstett lerst. Az
gensprogram a 2.12. brn lthat. Az rdekes rsz az LLAPOT-FRISSTS eljrs, amely a bels llapot
lersnak ltrehozsrt felels. Az j szlelseknek az llapotrl szl tuds tkrben trtn rtelmezse
mellett az gensprogram nyomon kveti a vilg lthatatlan rszeit a vilg fejldst ler informci
segtsgvel, az gensprogramnak pedig azt is tudnia kell, hogy az gens cselekvsei milyen hatssal lesznek a
vilg llapotra. Rszletesebb pldk a 10. s 17. fejezetben tallhatk.
2.13. bra - Egy modellalap, clorientlt gens. Nyomon kveti a vilg llapott s az
elrend clok halmazt is, s kivlaszt egy cselekvst, amely (vgs soron) cljainak
elrshez vezet.
41
Created by XMLmind XSL-FO Converter.
Intelligens gensek
Nha a clorientlt cselekvs vlaszts egyszer, amikor a cl teljeslse azonnal egyetlen cselekvssel elrhet.
Mskor sokkal trkksebb, amikor az gensnek befordulsok s visszakanyarodsok sorozatt kell megfontolnia
a cl elrshez. A keress (search) (lsd 36. fejezet) s a tervkszts (planning) (lsd 1112. fejezet) a
mestersges intelligencia azon terletei, amelyek az gens cljait elr cselekvssorozat megtallsval
foglalkoznak.
Vegyk szre, hogy ez a fajta dntshozatal alapjaiban klnbzik az elzkben ismertetett felttelcselekvs
szablyoktl, ezek magukban foglaljk a jv figyelembevtelt mind a Mi fog trtnni, ha ezt s ezt
teszem?, mind a Boldogg tesz ez majd engem? krdseket. Reflexszer gensek tervezsben ezeket
explicit mdon nem hasznljuk, mivel a tervez klnbz esetekre elre meghatrozta a helyes cselekvst. A
reflexszer gens fkez, ha fklmpt lt kigyulladni. Clorientlt elmletben gondolkodhat gy, hogyha az
elz aut fklmpi gnek, akkor az le fog lassulni. Az alapjn, ahogy a vilg ltalban mkdik, az egyetlen
cselekvs, amely elri azt a clt, hogy ne koccanjon neki ms autknak, a fkezs.
Br a clorientlt gens kevsb tnik hatkonynak, sokkal rugalmasabb, mivel a dntseit altmaszt tuds
explicit mdon megjelenik, s gy mdosthat. Ha elkezd esni az es, frisstheti a tudst arrl, hogy a fkek
mennyire lesznek hatkonyak ez automatikusan az sszes relevns viselkeds olyan megvltozst
eredmnyezi, hogy azok az j krlmnyhez igazodjanak. Reflexszer gensek esetben ugyanakkor, a felttel
cselekvs szablyok nagy szmt kellene trnunk. Termszetesen a clorientlt gens klnbz ti clok
elrsben is rugalmasabb. Egyszeren egy j cl megadsval a clorientlt genstl egy j viselkeds
megjelenst kaphatjuk. A reflexszer gens mikor fordulj s mikor menj egyenesen szablyai csak egy cl
esetben fognak mkdni: ki kell ket cserlni ahhoz, hogy egy j helyre menjen.
42
Created by XMLmind XSL-FO Converter.
Intelligens gensek
A hasznossgfggvny (utility function) egy llapotot (vagy llapotok egy sorozatt) egy olyan vals szmra
kpezi le, amelyik a hozz rendelt boldogsg fokt rja le. A hasznossgfggvny teljes meghatrozsa ktfle
olyan helyzetben tesz lehetv racionlis dntseket, amikor a clok erre alkalmatlanok. Egyrszt, amikor
egymsnak ellentmond clok vannak, amelyeknek csak egy rsze rhet el (mint pldul a biztonsgossg s a
sebessg), akkor a hasznossgfggvny meghatrozza a helyes kompromisszumot. Msrszt, amikor tbb cl
van, amelyek elrsre az gens trekedhet, s egyikk sem rthet el teljes bizonyossggal, a hasznossg olyan
mdszert ad, amivel a siker valsznsge a clok fontossghoz mrhet.
A 16. fejezetben megmutatjuk, hogy minden racionlis gensnek gy kell mkdnie, mintha rendelkezne
hasznossgfggvnnyel, amelynek vrhat rtkt maximalizlni akarja. Egy gens, amelynek van egy explicit
hasznossgfggvnye, ily mdon racionlis dntseket hozhat, s ezt egy ltalnos algoritmussal teheti meg,
amely nem fgg a maximalizland specifikus hasznossgfggvnytl. Ezltal a racionalits globlis
defincija amely azon gensfggvnyeket tekinti racionlisnak, amelyek a legnagyobb teljestmnyt hozzk
tvltozik a racionlisgens-tervezs egy helyi knyszerv, amely kifejezhet egy egyszer programban.
A hasznossgalap gens struktrja a 2.14. brn lthat. Valdi hasznossgalap gens programok az V.
rszben szerepelnek, ahol olyan dntshoz genseket terveznk, amelyeknek a rszlegesen megfigyelhet
krnyezetekben elkerlhetetlen bizonytalansgot is kezelnik kell.
2.14. bra - Egy modellalap, hasznossgalap gens. A vilg modellje mellett egy
hasznossgfggvnyt is alkalmaz, amely a vilg llapotaihoz rendelt preferenciit mri.
Ezek utn olyan cselekvst vlaszt, amely a legjobb vrhat hasznossghoz vezet, amit
az sszes lehetsges vgllapot elfordulsi valsznsgvel slyozott tlagolsval
szmt ki.
43
Created by XMLmind XSL-FO Converter.
Intelligens gensek
Egy tanul gens ngy koncepcionlis komponensre bonthat fel, ahogy azt a 2.15. bra mutatja. A
legfontosabb klnbsgttel a javtsokrt felels tanul elem (learning element) s a kls cselekvsek
kivlasztsrt felels vgrehajt elem (performance element) kztt van. A vgrehajt elem az, amit eddig a
teljes gensnek tekintettnk: ez vgzi az szlelseket, s ez dnt a cselekvsekrl. A tanul elem a kritikustl
(critic) kapott, az gens mkdsrl szl visszajelzst hasznlja annak megllaptsra, hogy a vgrehajt
elemet hogyan kell mdostani annak rdekben, hogy a jvben jobban mkdjn az gens.
A tanul elem tervezse nagyrszt a vgrehajt elem tervezstl fgg. Amikor egy olyan genst prblunk
tervezni, amely megtanul egy bizonyos kpessget, az els krds nem a hogyan fogom n ezt megtanulni?,
hanem a milyen teljestmnyelemre lesz az gensemnek szksge ennek vgrehajtshoz, ha mr megtanulta,
hogyan kell?. Ha adott egy megtervezett gens, tanul eljrsok az gens minden rsznek javtshoz
kszthetk.
44
Created by XMLmind XSL-FO Converter.
Intelligens gensek
A kritikus megmondja a tanul elemnek, hogy az gens milyen jl mkdik egy rgztett
teljestmnyszabvnyhoz viszonytva. A kritikus szksges, hiszen az szlelsek nmagukban nem jelzik az
gens sikeressgt. Pldul egy sakk program fogadhat egy olyan szlelst, hogy mattot adott az ellenfelnek, de
szksge van egy teljestmnyszabvnyra, hogy tudja, ez egy j dolog. Az szlels nmagban nem mondja meg
ezt. Fontos, hogy a teljestmnyszabvny rgztett legyen. Koncepcionlisan tekinthet gy, mintha az gensen
teljesen kvl lenne, mivel az gens nem mdosthatja azt sajt viselkedsnek megjavtsa rdekben.
A tanul gens utols komponense a problmagenertor (problem generator). Ennek feladata, hogy olyan
cselekvseket javasoljon, amelyek j s informatv tapasztalatokhoz vezetnek. Az a helyzet, hogy ha a
vgrehajt elem a sajt feje utn menne, akkor adott tudsa alapjn mindig a legjobb cselekvseket vlasztan.
De ha az gens hajland egy kis felfedezsre, s rvid tvon taln nhny szuboptimlis cselekvsre, hossz
tvon sokkal jobb cselekvseket fedezhet fel. A problmagenertor feladata, hogy ilyen felfedez cselekvseket
javasoljon. Ezt teszik a tudsok is, amikor ksrleteket vgeznek. Galilei nem gondolta, hogy a pisai torony
tetejbl kveket leejteni nmagban rtkes dolog. Sem a kveket nem prblta sszetrni, sem a szerencstlen
arra jrk agyt nem akarta megvltoztatni. Clja sajt agynak megvltoztatsa volt azltal, hogy az
objektumok mozgsnak egy jobb elmlett ismerje fel.
Hogy az ltalnos tervet konkrtabb tegyk, trjnk vissza az automata taxi pldjhoz. A vgrehajt elem
tartalmazza mindazon tudst s eljrsok halmazt, amelyek a taxivezets cselekvseinek kivlasztshoz
szksgesek. A taxi ezen vgrehajt elem segtsgvel megy ki az utakra s kzlekedik. A kritikus megfigyeli a
vilgot, s tovbbadja az informcit a tanul elemnek. Pldul miutn a taxi hrom forgalmi svon keresztl
egy gyors balkanyart vett, a kritikus megfigyeli a tbbi vezet ltal hasznlt sokkol nyelvezetet. Ebbl a
ksrletbl a tanul elem kpes egy szablyt formlni, miszerint ez egy rossz cselekvs volt, s a vgrehajt
elem mdosul az j szably beillesztsvel. A problmagenertor megfigyelheti a viselkeds bizonyos terleteit,
melyek javtsra szorulnak, s ksrleteket javasol, mint pldul a fkek kiprblst klnbz tfelszneken s
klnbz viszonyok kztt.
A tanul elem mdosthatja az gensdiagramokon (2.9., 2.11., 2.13. s 2.14. brk) tuds komponensek
brmelyikt. A legegyszerbb esetek magukban foglaljk az szlelsi szekvencibl trtn direkt tanulst. Az
egymst kvet krnyezeti llapot prok megfigyelse lehetv teszi az gens szmra annak megtanulst,
hogy a vilg hogyan vltozik, s cselekvsei eredmnyeinek megfigyelse lehetv teszi a mit okoznak a
cselekvseim megtanulst. Pldul ha a taxi vezetje adott ervel fkez, mikor a taxi nedves ton halad, akkor
hamarosan tapasztalni fogja, tnylegesen mekkora lassulst rt el. Vilgos, hogy ez a kt tanulsi feladat sokkal
nehezebb, ha a krnyezet csak rszlegesen figyelhet meg.
45
Created by XMLmind XSL-FO Converter.
Intelligens gensek
Az elz bekezdsben szerepl tanulsi formk nem ignyelnek hozzfrst kls teljestmnyszabvnyhoz
bizonyos rtelemben a mrtk univerzlis: a ksrletekkel sszhangban lev elrejelzsek ksztse. A helyzet
nmikpp bonyolultabb egy hasznossgalap gens szmra, amelyik a hasznossginformcit szeretn
megtanulni. Pldul tegyk fel, hogy a taxisofr gens nem kap borravalt az utasoktl, akiket az t folyamn
teljesen sszerzott. A kls teljestmnyszabvnynak informlnia kell az genst, hogy a borraval elvesztse
egy negatv hozzjruls az ltalnos teljestmnyhez ezek utn az gens megtanulhatja, hogy a hirtelen
manverek nem jrulnak hozz a hasznossghoz. Bizonyos rtelemben a teljestmnyszabvny a berkez
szlels egy rszt elklnti jutalomknt (reward) (vagy bntetsknt penalty), amely az gens viselkedsi
minsgnek direkt visszacsatolsa. A rgztett teljestmnyszabvnyok, mint pldul llatokban a fjdalom
vagy hsg, ily mdon rtelmezhetk. Ezt a krdst a 21. fejezetben trgyaljuk.
sszegezve, az genseknek sokfle komponensk van, s ezen komponensek sokflekppen reprezentlhatk az
gensprogramban, gy gy tnik, sokfle tanulsi mdszer ltezik. Van ugyanakkor egy egyest motvum. A
tanuls az intelligens gensekben sszefoglalhat gy, mint egy folyamat, amely az gens minden komponenst
gy mdostja, hogy az sszhangba kerljn a rendelkezsre ll visszacsatolt informcival, ily mdon nvelve
az gens ltalnos teljestmnyt.
5. sszefoglals
Ebben a fejezetben szlsebesen vgigszaladtunk a mestersges intelligencin, amelyet gy tekintettnk, mint az
genstervezs tudomnyt. A kvetkez fontos pontokra kell emlkeznnk:
Egy gens (agent) olyan valami, amely szlel s cselekszik egy krnyezetben. Az gensfggvny (agent
function) meghatrozza, hogy egy tetszleges szlelsi sorozathoz milyen cselekvst hajtson vgre az gens.
A teljestmnymrtk (performance measure) rtkeli az gens viselkedst egy krnyezetben. Egy
racionlis gens (rational agent) gy cselekszik, hogy maximalizlja a teljestmnymrtk vrhat rtkt
az addigi szlelsi sorozat alapjn.
A feladatkrnyezet (task environment) lersa tartalmazza a teljestmnymrtk, a kls krnyezet, a
beavatkozk s a szenzorok meghatrozst. Egy gens tervezse sorn az els lps mindig a
feladatkrnyezet minl teljesebb lersa.
A feladatkrnyezetek szmos lnyeges dimenzi mentn klnbzhetnek. Lehetnek teljesen vagy rszben
megfigyelhetk, determinisztikusak vagy sztochasztikusak, epizdszerek vagy sorozatszerek, statikusak
vagy dinamikusak, diszkrtek vagy folytonosak, valamint egygensesek vagy tbbgensesek.
Az gensprogram (agent program) implementlja az gensfggvnyt. Tbbfle alapvet gensfelpts
ltezik attl fggen, hogy milyen informci jelenik meg s hasznldik fel a dntsi folyamatban. A
konstrukci klnbzhet hatkonysgban, kompaktsgban s rugalmassgban. Az gensprogram
megfelel konstrukcija a krnyezet termszettl fgg.
Az egyszer reflexszer gensek (simple reflex agents) azonnal vlaszolnak az szlelsekre, mg a
modellalap reflexszer gensek (model-based reflex agents) a vilg aktulis szlelsekbl nem
nyilvnval aspektusait bels llapotukban tartjk nyilvn. A clorientlt gensek (goal-based agents)
cljaik elrse rdekben cselekszenek, a hasznossgorientlt gensek (utility-based agents) pedig sajt
boldogsgukat prbljk meg maximalizlni.
Minden gens javthatja a teljestmnyt tanuls (learning) segtsgvel.
46
Created by XMLmind XSL-FO Converter.
Intelligens gensek
ma mr szles krben elfogadott a szakmban, s ez lett az jabb rsok kzponti tmja (Poole s trsai 1998;
Nilsson 1998).
Az 1. fejezet a racionalits koncepcijnak gykereit a filozfira s kzgazdasgtanra vezette vissza. Az MIben a nyolcvanas vek kzepig ez a koncepci csak periferilis rdekldst kapott, amikor elkezdte elbortani a
terlet megfelel technikai megalapozsnak trgyalsait. Jon Doyle cikke azt jsolta, hogy a racionlis gensek
tervezse kpezi majd az MI f kldetst, mg ms npszer terletek levlnak j tudomnygakat formlva
(Doyle, 1983).
A krnyezetek tulajdonsgainak gondos figyelembevtele s hatsuk a racionlis gensek tervezsre leginkbb
a szablyozselmleti tradciban lthat pldul a klasszikus szablyoz rendszerek (Dorf s Bishop, 1999)
teljesen megfigyelhet, determinisztikus krnyezeteket kezelnek; a sztochasztikus optimlis vezrls (Kumar s
Varaiya, 1986) rszlegesen megfigyelhet, sztochasztikus krnyezeteket kezel; s a hibrid szablyoz
(Henzinger s Sastry, 1998) olyan krnyezetekkel foglalkozik, amelyek mind diszkrt, mind folytonos elemeket
tartalmaznak. A teljesen s a rszlegesen megfigyelhet krnyezetek kztti klnbsgttel az opercikutats
terletn kifejldtt dinamikus programozs (dynamic programming) irodalmban szintn kzponti krds
(Puterman, 1994), amit a 17. fejezetben fogunk trgyalni.
A reflexszer gensek voltak az elsdleges modellek a pszicholgiai behavioristk, mint pldul Skinner
(Skinner, 1953) szmra, aki megprblta az organizmusok pszicholgijt kizrlag bemenet/kimenet, avagy
inger/vlasz lekpezsekre visszavezetni. A pszicholgiban a behaviorizmustl a funkcionalizmusig jut
fejlds, amelyet legalbb rszben a szmtgp-metafora gensekre trtn alkalmazsa idzett el (Putnam,
1960; Lewis, 1966), az gens bels llapotnak a megjelenst eredmnyezte. Az MI munkinak nagy rsze az
llapottal rendelkez tiszta reflexszer gensek tlett tl egyszernek tartja ahhoz, hogy elrelpst jelentsen,
de Rosenschein (Rosenschein, 1985) s Brooks (Brooks, 1986) munkja megkrdjelezte ezt a felttelezst (25.
fejezet). Az elmlt vekben jelents munka zajlott annak rdekben, hogy hatkony algoritmusokat talljanak
komplex krnyezetek nyomon kvetsre (Hamscher s trsai, 1992). A Remote Agent program, amely a Deep
Space One rhajt vezrelte (lersa a 4. szakasz - A mestersges intelligencia jelenlegi helyzete tallhat) egy
klnsen meggyz plda (Muscettola s trsai, 1998; Jonsson s trsai, 2000).
A clorientlt genseket mindenhol feltteleztk, kezdve Arisztotelsz gyakorlati gondolkodsrl alkotott
nzettl McCarthy logikai MI-rl rt korai cikkeiig. A Shakey the Robot (Fikes s Nilsson, 1971; Nilsson,
1984) volt egy logikai, clorientlt gens els robot formj megtesteslse. A clorientlt gensek teljes logikai
elemzse Genesereth s Nilsson (Genesereth s Nilsson, 1987) cikkben jelent meg, s egy clorientlt
programozsi mdszertant, az gynevezett gensorientlt programozst Shoham (Shoham, 1993) dolgozott ki.
A clorientlt nzpont a kognitv pszicholgia hagyomnyban is dominns a problmamegolds terletn,
kezdve a jelents mrtkben meghatroz Human Problem Solving (Emberi problmamegolds) (Newell s
Simon, 1972) mvel, s folytatdva Newell ksbbi munkjban (Newell, 1990). A clok, tovbb bontva
vgyakra (ltalnos) s szndkokra (jelenleg kvetett), kzponti tmi a Bratman (Bratman, 1987) ltal
kifejlesztett genselmletnek is. Ez az elmlet hatssal volt mind a termszetes nyelv megrtsre, mind a
tbbgenses rendszerekre.
Horvitz kifejezetten azt javasolja, hogy az MI alapja a racionalits mint az elvrt hasznossg maximalizlsa
legyen (Horvitz s trsai, 1988). Pearl rsa (Pearl, 1988) volt az els az MI-ben, amely rszletesen trgyalta a
valsznsget s a hasznossgelmletet; az rs a bizonytalansg melletti kvetkeztets s dntshozatal
praktikus mdszereinek kifejtsvel valsznleg a legnagyobb nll tnyez volt a hasznossgorientlt
gensek fel trtn elmozdulsban a kilencvenes vekben (V. rsz).
A 2.15. brn bemutatott ltalnos tanul gens tervezs klasszikus a gpi tanuls irodalmban (Buchanan s
trsai, 1978; Mitchell, 1997). Ezen felpts programokban megtestesl pldi legalbb olyan messze nylnak
vissza, mint Arthur Samuel dmajtkot jtsz tanul programja (Samuel, 1959, 1967). A tanul genseket a VI.
rsz trgyalja rszletesen.
Az gensek s genstervezs irnti rdeklds gyorsan nvekedett az elmlt vekben, rszben az internet,
valamint az automatizlt s mobil szoftbotok irnti igny nvekedsvel (Etzioni s Weld, 1994). A relevns
cikkeket a Readings in Agentsben (Huhns s Singh, 1998), valamint a Foundations of Rational Agencyben
(Wooldridge s Rao, 1999) gyjtttk ssze. A Multiagent Systems (Weiss, 1999) nyjtja az genstervezs sok
aspektusnak egysges alapjt. Az genseknek szentelt konferencik kztt van az International Conference on
Autonomous Agents, az International Workshop on Agent Theories, Architectures, and Languages, s az
International Conference on Multiagent Systems. Vgezetl, a Dung Beetle Ecology (Ganajtr bogr kolgia)
47
Created by XMLmind XSL-FO Converter.
Intelligens gensek
(Hanski s Cambefort, 1991) rdekes informcik gazdag vlasztkt knlja a ganajtr bogarak
viselkedsrl.
5.2. Feladatok
2.1.
Definilja sajt vilgait a kvetkez fogalmakkal: gens, gensfggvny, gensprogram, racionalits,
autonmia, reflexszer gens, modellalap gens, clorientlt gens, hasznossgorientlt gens, tanul gens!
2.2.
Mind a teljestmnymrtk, mind a hasznossgfggvny azt mri, hogy mennyire dolgozik jl egy gens.
Magyarzza el a kztk lev klnbsget!
2.3.
Ez a gyakorlat felfedi az gensfggvnyek s a programok kztti klnbsgeket.
a. Lehetsges tbb mint egy gensprogram, amely egy adott gensfggvnyt valst meg? Adjon meg egy
pldt vagy mutassa meg, mirt nem lehetsges!
b. Vannak olyan gensfggvnyek, amelyeket nem lehet programmal megvalstani?
c. Rgztve egy gparchitektrt, igaz-e, hogy minden egyes gensprogram pontosan egy gensfggvnyt
valst meg?
d. Lehetsges tbb mint egy gensprogram, amely egy adott gensfggvnyt valst meg?
2.4.
Vizsgljuk meg klnbz porszvvilg-beli gensfggvnyek racionalitst!
a. Mutassa meg, hogy a 2.3. brn lthat egyszer porszv gensfggvny igenis racionlis a 2.2. szakasz Racionalits felsorolt felttelezsekkel!
b. rjon le egy racionlis gensfggvnyt arra a mdostott teljestmnymrtkre, amely levon egy pontot
minden elmozdulsrt! Szksge van-e a fggvnynek megfelel gensprogramnak bels llapotra?
c. Mutasson lehetsges gensterveket olyan esetekre, amikor tiszta ngyzetek piszkoss vlhatnak, s a
krnyezet geogrfija ismeretlen! rtelmes dolog-e, hogy ezekben az esetekben az gens sajt
tapasztalataibl tanuljon? Ha igen, akkor mit kellene megtanulnia?
2.5.
Az albbi gensek mindegyikre dolgozza ki a feladatkrnyezetek TKB-lerst!
a. Robot focijtkos;
b. Internetes knyvvsrl gens;
c. Autonm Mars terepjr;
d. Matematikusok ttelbizonyt segtje.
2.6.
A 2.5. plda minden egyes genstpusra jellemezze a krnyezeteket a 2.3. fejezetben megadott tulajdonsgok
alapjn, majd vlasszon ki megfelel gensterveket!
A kvetkez feladatok mindegyike egy krnyezetnek s egy sor gensnek a megvalstsra vonatkozik a
porszvvilgban.
48
Created by XMLmind XSL-FO Converter.
Intelligens gensek
2.7.
Valstson meg egy teljestmnymr krnyezetszimultort a 2.2. brn mutatott s 2.2. szakasz - Racionalits
specifiklt porszvvilgra! Implementcija legyen modulris, hogy knnyen megvltoztathassa az rzkelket,
a beavatkozkat s a krnyezeti jellemzket (mret, alak, piszok elhelyezkedse stb.). (Megjegyzs: Bizonyos
opercis rendszerekre s programozsi nyelvekre vannak ksz implementcik az internetes kdtrban.)
2.8.
Tervezzen s valstson meg egy tiszta reflexszer genst a 2.7. feladat krnyezetre! Minden lehetsges kezdeti
koszeloszlsra s genselhelyezkedsre futtassa le a krnyezetszimultort ezzel az genssel! Jegyezze fel az
gens teljestmnymrtkt minden egyes konfigurcira s az tlagos pontszmt is!
2.9.
Vizsglja meg a 2.7. gyakorlat egy mdostott krnyezett, amelyben az genst egy ponttal bntetik minden
egyes elmozdulsrt.
a. Lehet-e tkletesen racionlis egy egyszer reflexszer gens ebben a krnyezetben? Magyarzza meg,
mirt!
b. Mi a helyzet az llapottal rendelkez reflexszer gensekkel? Tervezzen egy ilyen genst!
c. Hogyan vltozna meg az (a) s (b) pontokra adott vlasza, ha az gens szlelsei a krnyezet sszes
ngyzetre megmondjk neki, hogy azok tisztk vagy piszkosak?
2.10.
Vizsglja meg a 2.7. feladat porszvkrnyezetnek egy mdostott vltozatt, amelyben a krnyezet alakja
mrete, hatrai s akadlyai ismeretlen, mint ahogy a kosz kezdeti elhelyezse is az! (Az gens mehet Fel s
Le, valamint Balra s Jobbra is.)
a. Lehet-e tkletesen racionlis egy egyszer reflexszer gens ebben a krnyezetben? Magyarzza meg,
mirt!
b. Egy randomizlt gensfggvnnyel rendelkez reflexszer gens jobban teljesthet egy egyszernl?
Tervezzen egy ilyen genst, s mrje meg a teljestmnyt klnbz krnyezetekben!
c. Tud olyan krnyezetet tervezni, ahol az n randomizlt gense igen rosszul fog teljesteni? Mutassa meg az
eredmnyeit!
d. Egy llapottal rendelkez reflexszer gens jobban teljesthet egy egyszernl? Tervezzen egy ilyen genst,
s mrje meg a teljestmnyt klnbz krnyezetekben! Tud ilyen tpus racionlis genst tervezni?
2.11.
Ismtelje meg a 2.10. feladatot egy olyan esetre, amikor az elhelyezkeds rzkelt egy tkzs rzkel
vltja fel, ami rzkeli az gens olyan elmozdulsi ksrleteit, amikor nekitkzik egy akadlynak vagy tlpi a
krnyezet hatrt! Tegye fel, hogy az tkzsrzkel mkdse lell! Hogyan kellene az gensnek
viselkednie?
2.12.
Az eddigi feladatok porszvkrnyezetei determinisztikusak
gensprogramokat a kvetkez sztochasztikus varicikra:
voltak.
Vizsgljon
meg
lehetsges
a. Murphy trvnye: az id 25%-ban a Felszvs mvelet nem tudja feltakartani a padlt, ha az piszkos,
illetve kinti r a koszt, ha az tiszta. Hogyan rinti az gens programjt az, ha a piszokrzkel az id 10%ban rossz vlaszt ad?
b. Kisgyerekek: minden idlpsben minden ngyzetnek 10% eslye van bekoszoldni. Tud javasolni egy
racionlis genstervet erre az esetre?
49
Created by XMLmind XSL-FO Converter.
3. fejezet - Problmamegolds
keresssel
Ebben a fejezetben megnzzk, hogy egy gens hogyan tudja megtallni azt a cselekvssorozatot, amely elvezet
a clhoz, ha erre egyetlen egyedi cselekvs sem elegend.
A 2. fejezetben emltett legegyszerbb gensek a reflexszer gensek voltak, amelyek cselekvsei az llapotok
s a cselekvsek kztti kzvetlen lekpzsen alapulnak. Az ilyen gensek nem kpesek olyan krnyezetben
tevkenykedni, ahol e lekpzs trolsi ignye tl nagy lenne, vagy ahol a lekpezs megtanulsa tl sok idt
venne ignybe. A clorientlt gensek azonban sikerrel jrhatnak a jvbeli cselekvseknek s annak a
szmbavtelvel, hogy ezen cselekvsek kimenetelei mennyire kvnatosak.
Ebben a fejezetben a clorientlt gensek egyik tpust, a problmamegold genst (problem-solving agent)
ismertetjk. A problmamegold gensek gy hatrozzk meg, mit is kell tennik, hogy olyan
cselekvssorozatokat keresnek, amelyek a kvnt llapotokba vezetnek. Azzal kezdjk, hogy pontosan
megfogalmazzuk a problmt s a megoldst felpt alkotelemeket, s szmos pldval illusztrljuk
ezen defincikat. Ezek utn nhny ltalnos rendeltets keressi algoritmust mutatunk be, amelyek e
problmk megoldsra alkalmasak, majd az egyes algoritmusok elnyeit sszehasonltjuk. Az algoritmusok
nem informltak (uninformed) abban az rtelemben, hogy a problma defincijn tlmenen ms
informcival a problmrl nem rendelkeznek. A 4. fejezet informlt (informed) keressi stratgikat trgyal,
amelyek rendelkeznek valamilyen elkpzelssel arrl, hogy a megoldst merrefel is kell keresni.
Ebben a fejezetben az algoritmuselmlet terletn hasznlt fogalmakat alkalmazzuk. Az aszimptotikus
komplexits (azaz az O() jellsmd) s az NP-teljessg fogalomkrben nem jratos olvas szmra az A)
fggelk nyjt bvebb informcikat.
1. Problmamegold gensek
Az intelligens gensekrl feltesszk, hogy a teljestmnymrtkket maximalizljk. Mint azt a 2. fejezetben
lttuk, a feladat valamelyest leegyszersdik, ha az gens egy clt (goal) tud maga el tzni, s megprblja azt
elrni. Elszr vizsgljuk meg, hogy az gens hogyan s mirt teheti ezt meg.
Tegyk fel, hogy az gensnk a romniai Arad vrosban tartzkodik, s orszgjr trja vge fel kzeledik.
Az gens teljestmnymrtke szmos tnyezt tartalmaz: pldul szpen le szeretne barnulni, tkletesteni
szeretn a romn nyelvtudst, ltni szeretn az sszes nevezetessget, lvezni az jszakai letet (amilyen van),
kerlni a msnapossgot stb. A dntsi problma igen bonyolult, sok kompromisszummal s tiknyvek gondos
tanulmnyozsval jr. Ttelezzk most fel, hogy gensnk egy Bukarestbl rvnyes, vissza nem vlthat
repljeggyel rendelkezik msnapra. Ebben a helyzetben rtelmes clnak (goal) tnik, hogy eljusson
Bukarestbe. Mindazon cselekvseket tovbbi mrlegels nlkl el lehet dobni, amelyekkel nem lehet idben
Bukarestbe rni, amivel az gens dntsi problmja nagymrtkben egyszersdik. A clok segtik
megszervezni a viselkedst, mivel korltozzk az gens ltal elrend dolgok szmt. A pillanatnyi helyzeten s
az gens hasznossgmrtkn alapul clmegfogalmazs (goal formulation) a problmamegolds els lpse.
Clnak a vilg llapotainak egy halmazt tekintjk, pontosabban azon llapotok halmazt, amelyekben a cl
teljesl. Az gens feladata megkeresni, hogy amely cselekvsek sorozata juttatja el t egy clllapotba. Mieltt
azonban ezt megtehetn, el kell dntenie, hogy milyen cselekvseket s llapotokat vizsgljon meg.
Amennyiben olyan szint cselekvsekkel kellene dolgoznia, mint pldul a bal lbadat tedd elrbb fl
mterrel vagy a kormnykereket hat fokkal tekerd balra, az gens mg a parkolbl sem lenne kpes
kihajtani, nemhogy idben eljutni Bukarestbe, mivel az ilyen rszletek szintjn a vilgban tl sok a
bizonytalansg, s a megolds tl sok lpsbl llna. A problmamegfogalmazs (problem formulation) az a
folyamat, amely sorn eldntjk, hogy amely cselekvseket s llapotokat vegynk figyelembe, ha egy cl
adott. Ezt a folyamatot rszletesebben is trgyalni fogjuk. Egyelre ttelezzk fel, hogy az gens az egyik
nagyobb vrosbl egy msik nagyobb vrosba val autzs szintjn szemlli a cselekvseket. Ebbl addan a
figyelembe vett llapotok annak felelnek meg, hogy az gens ppen egy adott vrosban van. 1
Vegyk szre, hogy ezek az llapotok valjban a vilg llapotaibl kpezett nagy halmazoknak felelnek meg, mivel a vilg llapotai a
valsg minden aspektust meghatrozzk. Fontos szben tartani a problmamegolds llapotai s a vilg llapotai kztti klnbsget.
1
50
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
Az gensnk azt tzte ki clul, hogy Bukarestbe megy, s azt fontolgatja, hogy Aradrl hov menjen. Hrom t
vezet ki Aradrl: egy Nagyszeben fel, egy Temesvr fel s egy Nagyzernd fel. Ezek egyike sem ri el
kzvetlenl a clt, gy amennyiben gensnk nem ismeri ki magt tkletesen Romniban, nem fogja tudni,
hogy melyik ton induljon el.2 Ms szval az gens nem fogja tudni eldnteni, hogy a lehetsges cselekvsek
kzl melyik a legjobb, mert nincs elegend informcija a cselekvsek hatsra elll llapotokrl.
Amennyiben az gensnek nem ll rendelkezsre tovbbi tuds, akkor itt megakad. A legjobb amit tehet, hogy a
cselekvsekbl vletlenszeren kivlaszt egyet.
Fontos
Tegyk fel azonban, hogy gensnknek akr papron, akr a fejben van egy Romnia-trkpe. A
trkp jelentsge, hogy informcit nyjthat az gensnek azokrl az llapotokrl, ahova eljuthat,
illetve a vgrehajthat cselekvsekrl. Az gens ezen informcit felhasznlhatja egy hipotetikus
utazs megtervezsre ezeken a vrosokon keresztl, hogy megtallja a legjobb utat, amely vgl
elvezet Bukarestbe. Miutn a trkpen megtallt egy utat Aradrl Bukarestbe, a cljt el tudja rni, ha
az utazs egyes llomsaihoz tartoz vezetsi szakaszokat vgrehajtja. ltalnossgban: amennyiben
egy gens eltt kzvetlenl tbb ismeretlen rtk lehetsg ll, ki tudja vlasztani, hogy mit tegyen, ha
elszr megvizsglja a klnbz lehetsges cselekvssorozatokat, amelyek ismert rtk llapotokba
vezetnek, majd ezutn kivlasztja a legjobbat.
Az ilyen sorozat ellltsi folyamatt keressnek (search) nevezzk. A keressi algoritmus bemenete egy
problma, kimenete pedig egy cselekvssorozat formjban elll megolds (solution). Miutn elllt egy
megolds, az abban szerepl cselekvseket vgre lehet hajtani. Ezt vgrehajtsi (execution) fzisnak szoks
nevezni. gy elllt egy egyszer fogalmazd meg, keresd meg, hajtsd vgre genstervezsi sma. Az elllt
smt a 3.1. bra mutatja. A cl s a megoldand problma megfogalmazsa utn az gens egy keressi eljrst
hv meg. Ezek utn a megoldst hasznlja cselekvsei vezrlsre, azt teszi, amit a megolds a kvetkez
lpsnek javasol ez tipikusan a cselekvssorozat els lpse , s a vgrehajtott lpst trli a
cselekvssorozatbl. Miutn a megoldst vgrehajtotta, az gens j clt keres.
Felttelezzk, hogy legtbb olvasnk ugyanebben a cipben jr, s knnyen t tudja rezni gensnk tancstalansgt. Ezton elnzst
krnk a romniai olvasktl, akik szmra ezen pedaggiai eszkz nem jelent segtsget.
2
51
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
Elszr a problmamegfogalmazs folyamatt rjuk le, majd a fejezet tovbbi rszeit a KERESS fggvny
klnbz vltozatainak ismertetsre fordtjuk. Ebben a fejezetben nem trgyaljuk rszletesen az LLAPOTFRISSTS s a CL-MEGFOGALMAZS fggvnyeket.
Mieltt a rszletekbe belemerlnnk, egy pillanatra lljunk meg s nzzk meg, hogy a problmamegold gens
hogyan illik bele a 2. fejezetben trgyalt gensek s krnyezetek sokasgba. A 3.1. brn lthat genstervezet
felttelezi, hogy a krnyezet statikus (static), mivel a problma megfogalmazsa s megoldsa semmilyen
vltozsrl nem vesz tudomst, amely esetleg a krnyezetben bell. Az genstervezet azt is felttelezi, hogy a
kezdeti llapot ismert. Ennek ismerete akkor a legknnyebb, amikor a krnyezet megfigyelhet (observable).
Az alternatv cselekvsek szmontartsa tulajdonkppen azt ttelezi fel, hogy a krnyezet diszkrt (discrete).
Vgl a legfontosabb: az genstervezet azt is felttelezi, hogy a krnyezet determinisztikus (deterministic). A
problmamegoldsok egyedi cselekvssorozatok, gy a vratlan esemnyeket nem is tudjk figyelembe venni. A
megoldsok vgrehajtsa radsul az rzkelsrl nem is vesz tudomst! Annak az gensnek, amely mondhatni
csukott szemmel hajtja vgre a terveit, elgg biztosnak kell lennie a dolgban (szablyozselmletben az ilyen
rendszereket nylt hurknak open-loop hvjk, mert az rzkelsek figyelmen kvl hagysa az gens s a
krnyezete kztti hurkot felbontja). E felttelezsek azt jelentik, hogy a krnyezetek lehet
legegyszerbbikvel foglalkozunk, s ez egyben indokolja azt is, hogy e fejezet mirt a knyv elejn tallhat.
A 3.6. alfejezet rvid bepillantst ad abba, hogy mi trtnik, amikor a megfigyelhetsg s a determinizmus
felttelezsrl lemondunk. Ezt a tmt sokkal mlyebben a 12. s a 17. fejezet trgyalja.
Menj(Temesvr),
Benn(Temesvr) ,
52
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
Az elbbi elemek definiljk a problmt s egy kzs adatstruktrba foghatk, amit a problmamegold
algoritmus bemenetnek tekintnk. A problma megoldsa (solution) nem ms, mint a kiindul llapotbl a
clllapotba vezet t. A megolds kvalitst az tkltsgfggvny mri, s egy optimlis megoldsnak
(optimal solution) a megoldsok kzt a legkisebb lesz az tkltsge.
53
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
2. Pldaproblmk
A problmamegold megkzeltst rengeteg feladatkrben alkalmaztk. Nhnyat az albbiakban sorolunk fel,
megklnbztetve az gynevezett jtk- s a valsvilg-beli problmkat. A jtkproblmk (toy problems)
rendeltetse, hogy segtsgkkel a klnfle problmamegold mdszereket illusztrlni tudjuk vagy ki tudjuk
prblni. Az ilyen problmk egzakt tmr lersa megadhat. Ez azt jelenti, hogy klnbz kutatk gy
knnyszerrel hasznlhatjk az algoritmusok hatkonysgi sszehasonltshoz A valsvilg-beli problmk
(real-world problems) azok, amelyek megoldsa tnyleg rdekes az emberek szmra. Ezeknek nincs egyetlen
ltalnosan elfogadott megfogalmazsuk, mi azonban megprbltuk rzkeltetni az ltalnos megfogalmazsuk
jellegt.
2.1. Jtkproblmk
54
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
Az els vizsglt plda a 2. fejezetben bevezetett porszvvilg (vacuum world) (lsd 2.2. bra). Ezt
problmaknt az albbi mdon definilhatjuk:
llapotok: az gens kt hely egyikben lehet. Mindegyik lehet piszkos, de lehet tiszta is. gy 2 2 2 = 8
lehetsges llapotrl beszlhetnk.
Kezdeti llapot: akrmelyik llapot lehet kezdeti llapot.
llapottmenet-fggvny: a hrom (Balra, Jobbra, Szv) cselekvs alkalmazsbl add leglis llapotokat
generlja. A teljes llapottr a 3.3. brn lthat.
Clteszt: ellenrzi, hogy minden ngyzet tiszta-e.
tkltsg: minden lps kltsge 1, gy az t kltsge megegyezik az t lpseinek a szmval.
A vals vilggal sszevetve e problma jellemzi a diszkrt lokcik, a diszkrt kosz, a megbzhat takarts,
valamint az, hogy takarts utn piszok soha nem keletkezik jra (a 3.6. alfejezetben ezeket a felttelezseket
feladjuk). Fontos megjegyezni, hogy az llapotot az gens s a kosz helyzete egyttesen hatrozza meg. Egy
nagyobb, n hely krnyezetben n 2n llapot van.
A 3.4. brn bemutatott 8-as kirakjtk (8-puzzle) egy 3 3-as tblbl, 8 szmozott kockbl s egy res
helybl ll. Az res hely melletti kockt be lehet cssztatni az res helyre. A cl egy meghatrozott lls, mint
pldul az bra jobb oldaln lthat lls elrse. A problma szoksos megfogalmazsa a kvetkez:
llapotok: az llapotlers meghatrozza mind a nyolc kocka s az res hely pozcijt a kilenc lehetsges
pozci egyikben.
Kezdeti llapot: akrmelyik lls lehet kezdeti llapot. Figyeljk meg, hogy minden egyes clt pontosan az
llapotok felbl lehet elrni (3.4. feladat).
llapottmenet-fggvny: a ngy cselekvs (res hely megy Balra, Jobbra, Fel, Le) alkalmazsbl add
leglis llapotokat generlja.
Clteszt: ellenrzi, hogy az llapot megegyezik-e a 3.4. brn mutatott clllapottal (ms clkonfigurci is
lehetsges).
tkltsg: minden lps kltsge 1, gy az t kltsge megegyezik az t lpseinek a szmval.
Problmamegolds keresssel
elvonatkoztattunk, mint a tbla megrzsa, ha a kockk megakadtak, vagy a kockk kssel val kiszedse s
visszahelyezse. Amit kaptunk, az a jtk szablykszlete, a manipulcik fizikai rszleteitl eltekintve.
A kirakjtk a cssztats kirakjtkok (sliding-block puzzles) csaldjba tartozik, amelyeket gyakran j
keres algoritmusok tesztelsre alkalmaznak az MI-ben. Ez az ltalnos osztly NP-teljes, gy nem vrhat,
hogy lnyegesen jobb mdszert lehet tallni az itt s a kvetkez bekezdsben lert keressi algoritmusoknl. A
8-as kirakjtknak 9!/2 = 181 440 elrhet llapota van, s gy e jtk knnyen megoldhat. A 15-s
kirakjtknak (a 4 4-es tbln) kb. 10 billi llapota van, s a legjobb algoritmusok a vletlenl generlt
eseteket optimlisan nhny milliszekundum alatt oldjk meg. A 24-es jtknak (az 5 5-s tbln) kb. 1025
llapota van, s a vletlenszeren kivlasztott esetek optimlis megoldsa mg mindig kemny di a jelenlegi
gpek s algoritmusok szmra.
A 8-kirlyn problma (8-queens problem) clja, hogy 8 kirlynt gy helyezznk el egy sakktbln, hogy
egyltaln ne tmadjk egymst. (Egy kirlyn egy vele azonos sorban, oszlopban vagy tlban lv bbut
tmad.) A 3.5. bra egy sikertelen megoldsi ksrletet mutat: a jobb szls oszlopban lv kirlynt tmadja a
bal fels sarokban lv kirlyn.
56
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
57
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
A krutazsi problmk (touring problems) az tkeressi problmk rokonai egy fontos klnbsggel.
Tekintsk pldul azt a problmt, hogy A 3.2. bra minden egyes vrosba ltogass el legalbb egyszer gy,
hogy Bukarestbl indulj, s az utat ott is fejezd be. Az tkeressi problmhoz hasonlan a cselekvs itt is kt
szomszdos vros kztti utazsnak felel meg. De ebben a problmban az llapottr alapveten ms. Az gens
helye mellett minden egyes llapotban trolni kell az gens ltal korbban megltogatott vrosokat is. gy a
kiindul llapot ebben az esetben a Bukarestben vagyok, eddig megltogattam {Bukarestet} llapot lenne,
mg egy tipikus kzbens llapot a Vasluiban vagyok, eddig megltogattam {Bukarestet, Csalnost, Vasluit}
llapot. A clteszt ellenrizn, hogy az gens Bukarestben van-e, s vgigltogatta-e mind a 20 vrost.
Az utaz gynk problma (Travelling Salesperson Problem TSP) egy krutazsi problma, amelyben
minden vrost pontosan egyszer kell megltogatni. A cl a legrvidebb t megkeresse. A problma NP-nehz,
de hatalmas erfesztsek trtntek a TSP-algoritmusok kpessgeinek javtsra. Ezen algoritmusokat az utaz
gynkk tjainak megtervezse mellett nyomtatott ramkrk furatainak ksztsnl a fr automata
mozgatsnak megtervezsre, tovbb ruhzak rakodgpeinek tvonaltervezsre is alkalmaztk.
A VLSI elhelyezsi (VLSI layout) problmban komponensek s sszekttetsek milliit egy chipen kell
elhelyezni, a terlet, az ramkri ksleltets s a szrt kapacitsok minimalizlsa s a gyrtsi kihozatal
maximalizlsa mellett. Az elhelyezsi problma a logikai tervezs fzist kveti, s ltalban kt rszbl ll:
cellaelrendezsbl (cell layout) s huzalozsbl (channel routing). A cellaelrendezs sorn az ramkr
primitv komponenseit cellkba rendezik, amelyek mindegyike valamilyen jl definilt funkcit lt el. Minden
egyes cellnak rgztett nyomtatsi kpe (mret s alak) van, s adott szm sszekttetst ignyel a tbbi
cellhoz. A cl az, hogy az egyes cellkat gy helyezzk el a chipen, hogy azok ne lapoldjanak t, s a cellk
kztt legyen megfelel hely az sszekt vezetkek szmra. A huzalozs sorn minden egyes vezetknek
megfelel vezetsi tvonalat keresnk a cellk kztt. Ezek a keressi problmk hihetetlenl sszetettek, de
mindenkppen rdemes a megoldsukat megtallni. A 4. fejezetben ltni fogunk nhny algoritmust, amelyek
kpesek megoldani ezeket a problmkat.
A robotnavigci (robot navigation) a korbban lert tkeressi problma ltalnostsa. Az utak diszkrt
halmaza helyett a robot egy folytonos trben mozog (elvben) vgtelen cselekvs- s llapothalmazzal. Egy
egyszer, sk felleten mozg kr alak robot esetn az llapot lnyegben ktdimenzis. Amennyiben a
robotnak karja s lba is van, akkor azokat is vezrelni kell, gy a keressi tr sokdimenziss vlik. Mr a
keressi tr vgess ttelhez is kifinomult technikkra van szksg. A 25. fejezetben megvizsglunk nhny
ilyen mdszert. A problma sszetettsge mellett a vals robotoknak foglalkozniuk kell az rzkelik ltal
szolgltatott jelek s a motorvezrlk hibival is.
sszetett objektumok robotok ltali automatikus sszeszerelst (automatic assembly sequencing) elszr a
FREDDY robot mutatta be (Michie, 1972). Azta lass, de biztos elrehalads tapasztalhat ezen a terleten. Ma
mr pldul villanymotorok automatikus sszeszerelse gazdasgossgi szempontbl is kivitelezhet. Az
sszeszerelsi feladatoknl a problma az alkatrszek sszeszerelsi sorrendjnek megkeresse. Amennyiben
rossz szerelsi sorrendet vlasztunk, valamikor a ksbbiek folyamn egy adott alkatrszt nem tudunk egy
msik alkatrsz kiszerelse nlkl beszerelni. Annak eldntse, hogy az sszeszerelsi sorrend egy lpse
megvalsthat-e vagy sem, a robotnavigcihoz hasonl sszetett geometriai keressi problma. gy az
sszeszerelsi sorrend megtervezsben a kltsges feladat egy kivitelezhet kvetkez lps megtervezse.
Minden gyakorlati fontossg algoritmusnak kerlnie kell az llapottr egy kis tredkn tlmen feltrst.
Egy msik fontos sszelltsi problma a fehrjetervezs (protein design), ahol a clkitzs olyan aminosavszekvencia megkeresse, amely valamilyen betegsg gygytsa szempontjbl lnyeges tulajdonsgokkal
rendelkezik s hromdimenzis fehrjv formlhat.
Az utbbi idben egyre nagyobb a kereslet az interneten keres (Internet searching) szoftverrobotok irnt,
amelyek krdsekre vlaszt, kapcsold informcikat, vagy kereskedelmi zletek lehetsgt kutatjk fel. A
keressi technikk szempontjbl ez igazn j alkalmazs, mert elgg nyilvnval, hogy az internethez egy
grfszer kp rendelhet, ahol a csompontok (weboldalak) linkekkel ssze vannak kapcsolva. Az
internetkeress teljes lerst a 10. fejezetre hagyjuk.
3. Megoldsok keresse
Az elzkben lttuk, hogyan kell egy problmt definilni. A htralv lps a megolds megkeresse az
llapottrben vgrehajtott keresssel trtnik. Ebben a rszben olyan keressi technikkkal foglalkozunk,
amelyek egy explicit keressi ft (search tree) hasznlnak, amelyet az llapotteret egyttesen definil kezdeti
llapotbl s az llapottmenet-fggvnybl generlnak. ltalnossgban, ha egy llapotot tbb ton is
58
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
elrhetnk, inkbb keressi grfrl, mint keressi frl beszlnk. Ezzel az igen fontos bonyoltssal ksbb a
3.5. alfejezetben foglalkozunk.
3.6. bra - Az Arad s Bukarest kztti tkeressi problma rszleges keressi fi. A
kifejtett csompontokat rnykoltuk, a legenerlt, de mg ki nem fejtett csompontok
vastagon keretezettek, a mg le nem generlt csompontokat pedig halvny szaggatott
vonalak jelzik.
A 3.6. brn lthatjuk az Arad s Bukarest kztti tkeres problma keressi fjnak egy kezdeti kifejtst. A
keressi fa gykere az a keressi csompont (search node), amely a Benn(Arad) kezdeti llapotnak felel meg.
Az els lps annak ellenrzse, hogy vajon ez clllapot-e. Nyilvnvalan nem az, de fontos ellenrizni, hogy
meg tudjuk oldani az olyan beugrat problmkat is, mint amilyen pldul az Aradrl indulva jussunk el
Aradra. Mivel ez nem clllapot, egyb llapotokat is meg kell vizsglnunk. Ezt az aktulis llapot kifejtsvel
(expanding) tesszk, azaz az llapottmenet-fggvnynek az aktulis llapotra trtn alkalmazsval, amivel
az llapotok egy j halmazt generljuk (generating). Ebben az esetben hrom j llapotot kapunk:
Benn(Nagyszeben), Benn(Temesvr) s Benn(Nagyzernd). Most el kell dntennk, hogy a hrom lehetsg
kzl melyik utat kvessk.
A keress lnyege a kvetkez: egy lehetsget kivlasztani, s a tbbit ksbbre halasztani arra az eshetsgre,
ha az els vlaszts nem vezetne megoldsra. Ttelezzk fel, hogy elsnek Nagyszebent vlasztjuk.
Ellenrizzk, hogy ez clllapot-e (nem az), majd kifejtjk, aminek hatsra a Benn(Arad), Benn(Fogaras),
Benn(Nagyvrad) s Benn(RimnicuVilcea) llapotokat kapjuk. Ezek utn e ngy kzl brmelyiket
vlaszthatjuk, vagy akr vissza is mehetnk s vlaszthatjuk Nagyzerndet vagy Temesvrt. Folytatjuk a
59
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
kivlasztst, a clllapot-ellenrzst s a kifejtst, mg egy megoldst nem tallunk, vagy amg el nem fogynak a
kifejtend llapotok. A kifejtend llapot kivlasztst a keressi stratgia (search strategy) hatrozza meg.
Az ltalnos fakeres algoritmus informlis megfogalmazst a 3.7. bra mutatja.
Fontos megklnbztetni az llapotteret s a keressi ft. Az tkeressi problma esetben az llapottr csak 20
llapotbl ll, minden egyes vroshoz tartozik egy llapot. Ebben az llapottrben azonban vgtelen sok t
vezet, gy a keressi fa vgtelen sok csompontbl ll. Pldul az AradNagyszeben, AradNagyszebenArad,
Arad NagyszebenAradNagyszeben hrom t az els hrom a vgtelen szm tszekvencibl. (Egy j
keressi algoritmus nyilvnvalan elkerli az ilyen utak kvetst. A 3.5. alfejezetben megmutatjuk hogyan.)
A csompontokat sokfle mdon lehet reprezentlni, de mi felttelezzk, hogy egy csompont egy t
komponensbl ll adatszerkezet:
LLAPOT: az llapottrnek a csomponthoz tartoz llapota;
SZL-CSOMPONT: a keressi fa azon csompontja, amely a krdses csompontot generlta;
CSELEKVS: a csompont szl-csompontjra alkalmazott cselekvs;
T-KLTSG: a kezdeti llapotbl a krdses csompontig vezet t ltalban g(n)-nel jellt kltsge, ahogy
ezt a szlmutatk jelzik;
MLYSG: a kezdeti llapotbl vezet t lpseinek a szma.
Fontos visszaidznnk a csompontok s az llapotok kzti klnbsget. A csompont egy adatnyilvntartsra
hasznlt adatszerkezet, amit egy keressi fa lersra hasznlunk. Egy llapot a vilg egy konfigurcija. gy a
csompontok a SZL-CSOMPONT mutatk ltal definilt meghatrozott ton tallhatk, mg az llapotok nem.
Tovbb knnyen elfordulhat, hogy kt klnbz csompont egyazon llapotot tartalmaz, ha ezt az llapotot
kt klnbz cselekvssorozattal generltk le. A csompont-adatstruktrt a 3.8. bra mutatja.
60
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
Valahogy nyilvn kell tartanunk a legenerlt, kifejtsre vr csompontokat is ezt a gyjtemnyt, listt
peremnek (fringe) nevezik. A perem minden eleme egy levlcsompont (leaf node), azaz egy olyan
csompont, amelynek a fban nincsenek kveti. A 3.6. brn a fk pereme a vastagon bekeretezett
csompontokbl ll. A perem legegyszerbb reprezentcija egy csomponthalmaz lenne. A keressi stratga
ekkor olyan fggvny lenne, amely a kvetkez lpsben kifejtend csompontot ebbl a halmazbl vlasztan
ki. Br elvi szempontbl ez nyilvnval megolds, szmtsigny szempontjbl drga lenne, mert a keressi
stratgia fggvnynek a halmaz minden egyes elemt vgig kellene nznie, hogy ki tudja vlasztani a legjobb
csompontot. Ezrt a tovbbiakban feltesszk, hogy a csompontgyjtemny egy vrakozsi sorknt (queue)
van megvalstva. A soron vgezhet mveletek az albbiak:
SORT-LTREHOZ(elem, ) ltrehoz egy az adott elemeket tartalmaz sort.
RES?(sor) csak akkor ad vissza igaz rtket, ha a sor res.
ELS-ELEM(sor) visszaadja a sor els elemt.
TVOLTSD-EL-AZ-ELS-ELEMET(sor) visszaadja az ELS-ELEM(sor)-t s ezt eltvoltja a sorbl.
BESZR(elem, sor) egy elemet szr be a sorba.
BESZR-MIND(elemek, sor) egy elemhalmazt beszr a sorba.
Ezen defincik felhasznlsval az ltalnos fakeressi algoritmus egy formlisabb defincijt adhatjuk meg.
Ezt a 3.9. bra mutatja.
61
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
62
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
3.10. bra - Szlessgi keress egy egyszer binris fban. Minden lpsnl a kvetkez
kifejtend csompontot egy marker jelzi.
A szlessgi keress elemzshez az elbbi rszben trgyalt ngy jellemzt fogjuk hasznlni. Knny beltni,
hogy ez a keress teljes. Ha a legseklyebb clcsompont valamilyen vges d mlysgben fekszik, a szlessgi
keress eljut hozz az sszes nla seklyebben fekv csompontot kifejtve (feltve persze, hogy a b elgazsi
tnyez vges). A legseklyebb clcsompont nem szksgkppen optimlis. Pontosabban a szlessgi keress
optimlis, ha az tkltsg a csompont mlysgnek nem cskken fggvnye (pldul ha minden cselekvsnek
ugyanannyi a kltsge).
Eddig a szlessgi keressnek csak a j tulajdonsgait lttuk. Ahhoz, hogy megrtsk mirt nem mindig ezt a
stratgit vlasztjuk, meg kell vizsglnunk a keress vgrehajtshoz szksges id s memria mennyisgt.
Ehhez egy olyan hipotetikus llapotteret vesznk alapul, amelyben minden egyes llapotot kifejtve b j llapot
keletkezik. A keressi fa gykrcsompontja b csompontot generl az els szinten, amelyek mindegyike jabb
b csompontot, sszesen b2 csompontot generl a msodik szinten. Ezek mindegyike jabb b csompontot
generl, sszesen b3 csompontot a harmadik szinten s gy tovbb. Ttelezzk fel, hogy ezen problma
megoldsa d mlysgben tallhat. Ekkor a legrosszabb esetben a d-edik szinten az utolst kivve (mert a clt
magt nem fejtjk ki) a csompontok mindegyikt ki kell fejtennk, a (d + 1)-edik szinten bd+1 b csompontot
generlva. A generlt csompontok ssz-szma gy:
b + b2 + b3 + ... + bd + (bd+1 b) = O(bd+1)
63
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
Minden legenerlt csompontot a memriban el kell trolni, mert vagy a perem eleme, vagy egy perembeli
csompont se. A trigny gy az idignnyel azonos (meg egy tovbbi csompont a gykr szmra).
Azok, akik jratosak a komplexitselemzsben, kezdenek aggdni (vagy izgatottak lesznek, ha szeretik a
kihvsokat), amikor exponencilis komplexitst ltnak, mint amilyen pldul az O(bd+1). A 3.11. bra
megmutatja, hogy mirt. Az bra egy b = 10 elgazsi tnyezvel rendelkez szlessgi keresst mutat a d
megolds mlysg tbb rtkre. A tblban felttelezzk, hogy msodpercenknt 10 000 csompontot
generlunk, illetve egy csompont trolshoz 1000 bjtra van szksg. Szmos feladvny jelleg problma
felel meg ezeknek a felttelezseknek (egy 100-as tnyezvel ide vagy oda), ha azokat modern szemlyi
szmtgpeken futtatjuk.
Fontos
A 3.11. bra alapjn kt tanulsgot vonhatunk le. Elszr is a szlessgi keress esetn a trigny
nagyobb problmt jelent az idignynl. A legtbb ember, amennyiben rdekli a vlasz egy fontos
problmra, trelmesen ki tud vrni 31 rt, hogy egy 8 mlysg keress lefusson, de csak kevs
szmtgpnek van a keresshez szksges Tbjtnyi memrija. Szerencsre lteznek ennl kevesebb
memrit ignyl keressi algoritmusok is.
3.11. bra - A szlessgi keress id- s trignye. Az bra adatai b = 10-es elgazsi
tnyezt, 10 000 csompont/percet s 1000 bjt/csompontot feltteleznek.
Fontos
A msodik tanulsg, hogy az idigny mg mindig fontos tnyez. Ha a problmnk 12 mlysg,
akkor (a felttelezseink mellett) a szlessgi keressnek (vagy akrmlyik nem informlt keressi
algoritmusnak) 35 vbe telne a megolds megtallsa. ltalnossgban az exponencilis komplexits
keressi problmk kzl csak a legkisebb problmapldnyok oldhatk meg.
64
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
3.12. bra - Mlysgi keress egy binris keressi fban. A kifejtett csompontok,
amelyeknek a peremben nincsenek kvetik, el is hagyhatk a memribl. Ezeket
feketvel jelltk meg. A 3-as mlysg csompontokrl felttelezzk, hogy nincsenek
kvetik, valamint azt is feltesszk, hogy M az egyetlen clcsompont.
65
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
66
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
amely O(bd) idkomplexitst eredmnyez. sszehasonltsul nzzk meg a szlessgi keress ltal generlt
csompontok szmt:
Cs(SZK) = b + b2 + ... + bd + (bd+1 b)
Vegyk szre, hogy a szlessgi keress d + 1 mlysgben is generl csompontokat, az iteratvan mlyl
keresssel ellenttben. Ennek eredmnye, hogy az iteratvan mlyl keress a szlessgi keressnl gyorsabb,
annak ellenre, hogy a csompontokat tbbszr fejti ki. Konkretizlva, pldul b = 10 s d = 5 esetn ezek a
szmok:
Cs(IMK) = 50 + 400 + 3000 + 20 000 + 100 000 = 123 450
Cs(SZK) = 10 + 100 + 1000 + 10 000 + 100 000 + 999 990 = 1 111 100
Fontos
ltalnossgban nagy keressi trrel rendelkez problmk esetn s ha a megolds mlysge nem
ismert, a nem informlt mdszerek krbl az iteratvan mlyl keress a javasolt.
Problmamegolds keresssel
3.15. bra - Az iteratvan mlyl keressi algoritmus ngy itercija egy binris fn
Az iteratvan mlyl keress a szlessgi keresssel abban rokon, hogy minden iterciban a csompontok
teljes rtegt megvizsglja, mieltt a kvetkez rtegre trne r. Hasznosnak ltszik az egyenletes kltsg
keress iteratv vltozatnak kifejlesztse, amely rkln ez utbbi optimalitst, mellzve annak a
trkvetelmnyeit. Az tlet a nvekv tkltsgkorlt hasznlata a nvekv mlysgkorlt helyett. Az
eredmnyl kapott algoritmussal, amelynek neve iteratvan megnyl keress (iterative lengthening search)
a 3.11. feladat foglalkozik. Sajnos az derl ki, hogy az iteratvan megnyl keress overheadje tekintlyes az
egyenletes kltsg keresshez kpest.
68
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
A ktirny keresst gy implementljk, hogy az egyik vagy mindkt keress egy csompont kifejtse eltt
megvizsglja, hogy az nem rsze-e a msik keressi fa peremnek. Ha igen, megvan a cl. Ha a problma
pldul d = 6 megolds mlysg, s mindegyik irnyban a szlessgi keresst futtatjuk csompontonknt, a kt
keress a legrosszabb esetben akkor tallkozik, ha mindegyik algoritmus a 3-as mlysgben egy csompont
kivtelvel minden csompontot kifejtett. A b = 10 esetn ez 22 200 csompont generlst jelenti a standard
szlessgi keress ltal generlt 1 111 111 csomponthoz kpest. Annak ellenrzst, hogy egy csompont a
msik keressi fhoz tartozik-e, egy hash-tblval konstans idben meg lehet oldani. A ktirny keress
idkomplexitsa gy O(bd/2). Legalbb az egyik keressi ft a memriban kell tartani, hogy a tartozs
ellenrzse kivitelezhet legyen, a trkomplexits teht szintn O(bd/2). Ez a trkomplexits a ktirny keress
legnagyobb gyengje. Ha mindkt keress szlessgi keress, az algoritmus teljes s optimlis (egyenletes
kltsg esetn). Ms mdszerek kombincija vagy a teljessg, vagy az optimalits, vagy mindkett
elvesztshez vezethet.
Az idkomplexits mrsklse a ktirny keresst igen vonzv teszi, de mit is jelent a clllapotbl htrafel
keresni? Ez nem is olyan egyszer, mint amilyennek hangzik. Legyenek x csompont eldcsompontjai
(predecessors), az Eld(x)-ek azon csompontok, amelyek mindegyiknek x a kvet csompontja. A ktirny
keress felttelezi, hogy egy Eld(x) hatkonyan szmthat. Legegyszerbb az az eset, amikor az sszes
cselekvs az llapottrben reverzbilis, gy Eld(x) = Kvet(x). Ms esetben azonban igen nagy tletessgre
lehet szksg.
Nzzk most, hogy mit is jelent az, hogy cl, ha a clllapotbl htrafel kell keresni. A 8-as kirakjtk s a
romniai tkeress esetn egyetlenegy clllapot ltezik csak, gy a htrafel keress s az elrefel keress igen
hasonltanak egymsra. Amennyiben ltezik a clllapotoknak egy explicit listja, mint pldul a 3.3. bra kt
koszmentes clllapota, akkor megkonstrulhatunk egy olyan l-clllapotot, amelynek kzvetlen kveti az
aktulis clllapotok. Ms mdon, nhny redundns csompont-generls elkerlhet azzal, hogy a
clllapotok halmazt egyetlenegy clllapotnak tekintjk, amelynek minden eldje szintn egy llapothalmaz
konkrtan azon llapotok halmaza, amelyek kvetje a clllapothalmaz eleme (lsd mg 3.6. alfejezet).
69
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
Fontos
A mlysgi keress csak a gykeret s az aktulis csomponttal sszekt ton fekv llapotokat
trolja. E csompontoknak az aktulis csomponttal val sszehasonltsa lehetv teszi a hurkok
felismerst, amiket ezek utn azonnal el lehet dobni. Ez meg is vd attl, hogy a hurkok rvn vges
llapotterekbl ne keletkezzenek vgtelen keressi fk. Sajnos azonban nem tud megvdeni a nem
70
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
hurkos utak exponencilis megsokszorozdstl az olyan problmkban, mint amilyenek a 3.18. brn
lthat. Ezt elkerlni csak gy lehet, hogy tbb csompontot tartunk a memriban. Az id s a
trigny kztt egy alapvet kompromisszum ltezik. Az az algoritmus, amely elfelejti a trtnett,
knytelen azt megismtelni.
Ha egy algoritmus minden megltogatott llapotra emlkszik, akkor kzvetlen mdon fedezi fel az llapotteret.
A FA-KERESS algoritmust mdosthatjuk gy, hogy egy zrt listnak (closed list) nevezett adatszerkezetet
tartalmazzon, amely minden kifejtett csompontot trol. (A mg ki nem fejtett csompontokbl ll peremet
nha nyitott listnak [open list] nevezik.) Ha az aktulis llapot egybeesik a zrt listn lv llapotok
egyikvel, akkor eldobhat, ahelyett hogy a kifejtsvel kellene foglalkozni. Az j algoritmus neve GRFKERESS (3.19. bra). Az ismtld llapotokat tartalmaz problmk esetn a GRF-KERESS sokkal
hatkonyabb, mint a FA-KERESS. Az algoritmus a legrosszabb esetre szmtott tr- s idkomplexitsa arnyos
az llapottr mretvel, ami sokkal kisebb lehet, mint O(bd).
A grfkeress optimalitsa mr trkks dolog. Korbban azt mondtuk, hogy egy ismtelt llapot detektlsval
az algoritmus kt utat tallt ugyanahhoz az llapothoz. A 3.19. brn lthat GRF-KERESS algoritmus mindig
az jonnan felfedezett utat dobja el. Nyilvnval, hogy ha az jonnan felfedezett t rvidebb, mint az eredeti, a
GRF-KERESS elvthet egy optimlis megoldst. Szerencsre ki tudjuk mutatni (lsd 3.12. feladat), hogy az
egyenletes kltsg s a konstans lpskltsg szlessgi keress esetn ez nem trtnhet meg. E kt optimlis
fakeressi stratgia egyben optimlis grfkeressi stratgia is. Az iteratvan mlyl keress azonban mlysgi
kifejtst hasznl s knnyen kerlhet egy csompont fel vezet szuboptimlis tra, mieltt megtalln a hozz
vezet optimlis utat. Az iteratvan mlyl grfkeressnl teht egy jonnan felfedezett tnl meg kell
vizsglni, hogy ez nem jobb-e, mint az eredeti. s ha igen, szksg lehet az adott csompont kvetinl a
mlysgek s az tkltsgek revzijra.
3.18. bra - Egy exponencilisan nagyobb keressi ft generl llapottr. (a) Egy olyan
llapottr, amelyben kt lehetsges cselekvs vezethet A-bl B-be, kett B-bl C-be s
gy tovbb. Ez az llapottr d+1 llapotot tartalmaz, ahol d a maximlis mlysg. (b) Az
(a) llapottr megfelel keressi fja, 2d ggal, amely az llapotr 2d tjnak felel meg.
(c) Egy ngyzetrcs. A kezdeti (A) llapottl ktlpsnyire fekv llapotokat szrke
sznnel jelltk.
3.19. bra - Az ltalnos grfkeres algoritmus. A zrt halmazt egy hash-tblval lehet
implementlni, hogy az ismtelt llapotokat hatkonyan ellenrizni tudjuk. Ez az
algoritmus felttelezi, hogy az s llapothoz vezet els t a legolcsbb (lsd szveg).
71
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
Jegyezzk meg, hogy a zrt lista hasznlata azt jelenti, hogy a mlysgi s az iteratvan mlyl keress
trignye mr nem lineris. Mivel a GRF-KERESS algoritmus minden csompontot a memriban megtart,
egyes keressi fajtk kivitelezhetetlenek a memriakorltok miatt.
Problmamegolds keresssel
llapotnak neveznk (belief state), amely az gens pillanatnyi hiedelmt fejezi ki, hogy maga vajon milyen
fizikai llapotban lehet most. (A teljesen megfigyelhet krnyezetben minden hiedelmi llapot egyetlen fizikai
llapotbl ll.)
Ahhoz, hogy egy szenzor nlkli problmt megoldhassunk, a fizikai llapotok terben trtn keress helyett a
hiedelmi llapotok terben kell keresni. A kezdeti llapot egy hiedelmi llapot, s minden cselekvs egy
hiedelmi llapotbl egy hiedelmi llapotba kpez le. Egy cselekvst gy kell alkalmazni egy hiedelmi llapotra,
hogy a hozz tartoz minden fizikai llapotra kell azt alkalmazni, s az eredmnyek unijt kell kpezni. Egy t
most tbb hiedelmi llapotot kt ssze, a megolds pedig egy olyan utat jelent, amely csak clllapotokbl ll
hiedelmi llapotba vezet. A 3.21. bra mutatja a determinisztikus szenzor nlkli porszvvilg hozzfrhet
hiedelmi llapottert. Csak 12 hozzfrhet hiedelmi llapot ltezik, az egsz hiedelmi llapottr azonban
tartalmazza a fizikai llapotok minden lehetsges halmazt, azaz 2 8 = 256 hiedelmi llapotot. ltalban, ha a
fizikai llapottrnek S llapota van, a hiedelmi llapottr llapotainak szma 2S.
73
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
A szenzor nlkli problmk eddigi elemzsben determinisztikus cselekvseket tteleztnk fel. Az elemzs
lnyegben rvnyes marad, ha a krnyezet nemdeterminisztikus, azaz ha a cselekvseknek nhny lehetsges
kimenetele lehet. Ennek az az oka, hogy szenzorok nlkl az gens nem kpes megmondani, hogy milyen
kimenetel trtnt valjban. A klnbz lehetsges kimenetelek gy ptllagos fizikai llapotok a kvet
hiedelmi llapotban. Ttelezzk fel pldul, hogy a krnyezetben Murphy-trvny uralkodik: a Szv cselekvs
nha koszt is hagy a sznyegen, de csak akkor, ha ott elzetesen a kosznak nyoma sem volt.6 Ha a Szv
cselekvst teht a 4. fizikai llapotban alkalmazzuk (lsd 3.20. bra), a kt lehetsges kimenetel a 2. s a 4.
llapot. A kezdeti {1, 2, 3, 4, 5, 6, 7, 8} hiedelemllapotra alkalmazva a Szv olyan hiedelemllapothoz vezet,
ami a cselekvs eredmnyeinek unija a nyolc fizikai llapotra. Kiszmtva, azt kapjuk, hogy az j hiedelmi
llapot az {1, 2, 3, 4, 5, 6, 7, 8}. A Szv cselekvs a Murphy-trvny uralta vilgban egy szenzor nlkli gens
hiedelmi llapott teht nem vltoztatja meg! A problma valjban megoldhatatlan (lsd 3.18. feladat). Ennek
intuitv magyarzata az, hogy az gens nem kpes megmondani, hogy az aktulis mez koszos-e, ebbl
kifolylag nem kpes megmondani, hogy a Szv cselekvs takartani fog-e, vagy mg tbb koszt hagy maga
utn.
74
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
A megoldsok tert gy azzal a lehetsggel bvtjk, hogy a cselekvseket a vgrehajts alatt megjelen
eshetsgek alapjn vlasztjuk. A vals fizikai vilg szmos problmja eshetsgi problma, hiszen pontos
elrejelzs lehetetlen. Sok ember ezrt tartja mindig nyitva a szemt sta s vezets kzben.
Az eshetsgi problmk nha rgztett cselekvsszekvencival is megoldhatk. Tekintsk pldul a teljesen
megfigyelhet Murphy-trvny vilgot. Eshetsggel llunk szemben, ha az gens a Szv cselekvst egy res
ngyzet felett hajtja vgre, hiszen a kosz akkor vagy meg fog jelenni, vagy sem. Ameddig az gens soha nem
teszi ezt, eshetsgek fel sem merlnek, s minden kezdeti llapotbl ltezik egy rgztett megoldsi szekvencia
(lsd 3.18. feladat).
Eshetsgi problmk esetn az algoritmusok az e fejezetben tallhat standard keressi algoritmusoknl
bonyolultabbak. Ezekkel a 12. fejezet foglalkozik. Az eshetsgi problmk egy kiss eltr gens tervezsi
smt is tmogatnak, amelyekben az gens egy garantlt terv megtallsa eltt is cselekedhet. Ez hasznos, mert
ahelyett, hogy a vgrehajts sorn elfordul minden eshetsget elre figyelembe venne, gyakran jobb
elkezdeni a vgrehajtst, s megnzni, hogy mely eshetsgek kvetkeznek be valjban. A jrulkos informci
megadsa utn az gens folytathatja a problma megoldst. A keress s a vgrehajts ily mdon trtn
sszefslse (interleaving) a feldertses problmk (lsd 4.5. alfejezet) vagy a jtkok (6. fejezet) esetn is
hasznos.
7. sszefoglals
Ez a fejezet olyan mdszereket ismertetett, amelyekkel az gens a cselekvseit vlaszthatja meg
determinisztikus, megfigyelhet, statikus s teljesen ismert krnyezetben. Ilyen esetekben az gens olyan
cselekvssorozatokat konstrulhat, amelyekkel a cljait elrheti. Ezt a folyamatot keressnek (search)
nevezzk.
A megolds keressnek megkezdse eltt az gensnek elbb meg kell fogalmaznia a clt (goal), majd a clt
fel kell hasznlnia a problma megfogalmazsra.
Egy problma (problem) ngy rszbl: a kiindul llapotbl (initial state), egy cselekvs- (action)
kszletbl, egy clteszt- (goal test) fggvnybl s egy tkltsg- (path cost) fggvnybl ll. A problma
krnyezett az llapottr (state space) rja le. Az llapottrben a kiindul llapotbl a clllapotba vezet t
(path) a problma egy megoldsa (solution).
Egyetlen ltalnos FA-KERESS algoritmus felhasznlhat brmilyen problma megoldsra. Az algoritmus
konkrt vltozatai eltr stratgikat valstanak meg.
A keressi algoritmusokat azok teljessge (completeness), optimalitsa (optimality), idignye (time
complexity) s trignye (space complexity) alapjn rtkeljk. A komplexitst a problma b elgazsi
tnyezje s a legseklyebben fekv megolds d mlysge hatrozza meg.
A szlessgi keress (breadth-first search) elszr a legseklyebben fekv csompontot fejti ki a keressi
fban. Ez a keress teljes, azonos kltsg opertorok esetn optimlis s O(bd) id- s trignnyel
rendelkezik. Trignye miatt a legtbb esetben nem clszer alkalmazni. Az egyenletes kltsg keress
(uniform-cost search) hasonl a szlessgi keresshez, de elszr a legkisebb g(n) tkltsg csompontot
fejti ki. Teljes s optimlis, ha minden lps kltsge valamilyen pozitv korltnl nagyobb.
A mlysgi keress (depth-first search) elszr a keressi fa legmlyebben fekv csompontjt fejti ki. Se
nem teljes, se nem optimlis, s idignye O(bm), trignye pedig O(bm), ahol m az llapottrbeli utak
maximlis mlysge.
75
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
76
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
mdszereit Shahookar s Mazumder (Shahookar s Mazumder, 1991) tekintettk t, szmos optimalizcis cikk
VLSI-jsgokban jelent meg. Robotnaviglsi s szerelsi problmkkal a 25. fejezet foglalkozik.
A problmamegolds nem informlt keressi algoritmusai kzponti szerepet tltenek be a klasszikus
szmtselmletben (Horowitz s Sahni, 1978), az opercikutatsban (Dreyfus, 1969). Deo s Pang, tovbb
Gallo s Pallottino egy frissebb ttekintst adnak errl a terletrl (Deo s Pang, 1984; Gallo s Pallottino,
1988). A szlessgi keresst labirintusok megoldsra Moore (Moore, 1959) fogalmazta meg. A dinamikus
programozs (dynamic programming) mdszere (Bellman s Dreyfus, 1962), amely szisztematikusan jegyzi
meg az sszes nvekv nagysg rszproblma megoldst, egy grfokon fut szlessgi keressnek tekinthet.
A Dijkstra-fle ktpontos legrvidebb t algoritmus (Dijkstra, 1959) az egyenletes kltsg keress
kiindulpontja.
Az iteratvan mlyl algoritmus egy vltozatt Slate s Atkin hasznlta elszr a CHESS 4.5 sakkprogramjban
(Slate s Atkin, 1977), hogy a sakkrt hatkonyabban lehessen hasznlni. De az tletet grfokban a
legrvidebb t keressre elszr Korf hasznlta (Korf, 1985a). A Pohl bevezette ktirny keress (Pohl, 1969;
1971) bizonyos esetekben szintn igen hatkony lehet.
A rszben megfigyelhet s a nemdeterminisztikus krnyezeteket a problmamegoldsi megkzeltsen bell
nem tanulmnyoztk behatan. A hiedelmi llapotok terben trtn keress bizonyos hatkonysgi
problmival Genesereth s Nourbakhsh foglalkoztak (Genesereth s Nourbakhsh, 1993). Koenig s Simmons
(Koenig s Simmons, 1998) az ismeretlen kezdeti pozcibl indul robotnaviglst tanulmnyoztk. Erdmann
s Mason (Erdmann s Mason, 1988) pedig a szenzorok nlkli robot manipulci problmjt vizsgltk a
hiedelem llapottrbeli keress folytonos vltozatt hasznlva. Eshetsgi keresssel a tervkszts terleten
bell foglalkoztak (lsd 12. fejezet). A bizonytalan informcit felhasznl tervksztst s cselekvst a
valsznsg-elmlet s dntselmlet eszkztrval oldottk meg (lsd 17. fejezet).
Nilsson knyvei a klasszikus keressi algoritmusokkal kapcsolatban hasznos informcikat tartalmaznak
(Nilsson, 1971; 1980). Korf egy tfog, naprakszebb ttekintst ad a klasszikus keressi algoritmusokrl (Korf,
1988). Az j keressi algoritmusokrl amelyek feltrsa figyelemre mlt mdon folytatdik olyan
folyiratokban jelennek meg cikkek, mint pldul az Artificial Intelligence.
7.2. Feladatok
3.1.
Definilja sajt szavaival a kvetkez fogalmakat: llapot, llapottr, keressi fa, keressi csompont, cl,
cselekvs, llapottmenet-fggvny s elgazsi tnyez.
3.2.
Magyarzza meg, hogy a problmamegfogalmazsnak mirt kell a clmegfogalmazst kvetnie.
3.3.
Tegyk fel, hogy a LEGLIS-CSELEKVS(s) azon cselekvsek halmazt jelli, amelyek leglisak az s llapotban,
s az EREDMNY(a, s) pedig azt az llapotot, ami az s llapotban a vgrehajtott leglis cselekvs eredmnye.
Definilja az LLAPOTTMENET-FV-t a LEGLIS-CSELEKVS s az EREDMNY fggvnyben, s megfordtva.
3.4.
Mutassa meg, hogy a 8-as jtk llapottere kt diszjunkt rszbl ll, ahol egyik rszhez tartoz llapotot
semmilyen vges lpsszekvencival sem lehet a msik rszhez tartoz llapotba ttranszformlni. (Segtsg:
Berlekamp s trsai, 1982). Dolgozzon ki egy eljrst, amely el tudja dnteni, hogy az llapot melyik rszhez
tartozik, s magyarzza meg, hogy ez mirt hasznos, ha az llapotokat vletlen mdon generljuk.
3.5.
Gondolja t az n-kirlyn problmt a 2.1. szakasz - Jtkproblmk rszben ismertetett hatkony
inkrementlis megfogalmazst felhasznlva. Magyarzza meg, hogy az llapottr mrete mirt lesz legalbb
s becslje meg azt a legnagyobb n-et, amire a kimert feltrs mg elfogadhat. (Segtsg: szmolja ki az
77
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
elgazsi tnyez als korltjt figyelembe vve, hogy mekkora a kirlyn ltal tmadhat sakktblahelyek
maximlis szma egy tetszleges oszlopban.)
3.6.
Egy vges llapottr mindig vges keressi fhoz vezet-e? Mi a helyzet egy olyan vges llapottrrel, amely
maga is egy fa? Meg tudja-e preczebben fogalmazni, hogy milyen llapottrfajtk vezetnek mindig vges
keressi fkhoz? tvve (Bender, 1996)-bl.
3.7.
Az albbiak mindegyikhez adja meg a kiindul llapotot, a cltesztet, az llapottmenet-fggvnyt s az
tkltsgfggvnyt. Vlasszon meg egy olyan megfogalmazst, amely elegenden precz, hogy azt
implementlni lehessen.
a. Ngy szn felhasznlsval ki kell szneznie egy skbeli trkpet gy, hogy minden szomszdos tartomny
klnbz szn legyen.
b. Egy 1 m magas majom egy szobban tartzkodik, ahol van kt 1 m magas lda (amelyeket egymsra lehet
rakni, lehet mozgatni, s meg lehet mszni), s nhny bann lg a 2,5 m magas mennyezetrl. A majom el
szeretn rni a bannt.
c. Van egy olyan programja, amely illeglis input rekord zenetet ad, ha az input rekordok egy bizonyos
llomnyt dolgozza fel. n tudja, hogy egy-egy rekord feldolgozsa a tbbitl fggetlen. Szeretn az
illeglis rekordot megtallni.
d. Van hrom kancsja, egy 12 l-es, egy 8 l-es s egy 3 l-es s egy vzcsapja. A kancskat megtltheti, kintheti
bellk a vizet a fldre, vagy az egyikbl ttltheti a vizet egy msikba. Pontosan 1 l vizet kell kimrnie.
3.8.
Tekintsen egy olyan llapotteret, ahol a kezd llapot az 1-es szm s az llapottmenet-fggvny az n
sorszm llapotra kt llapottal, a 2n s a 2n + 1 sorszm llapotokkal tr vissza.
a. Rajzolja fel az llapottrnek az 1-es llapottl a 15-es llapotig terjed rszt.
b. Ttelezze fel, hogy a clllapot a 11-es. Listzza ki a csompontok kifejtsi sorrendjt szlessgi, 3-as
mlysgkorlttal rendelkez mlysgkorltos s iteratvan mlyl keress esetn.
c. J lenne-e a problma megoldsra a ktirny keress? Ha igen, magyarzza meg rszletesen, hogyan fog ez
mkdni.
d. Mennyi a ktirny keress elgazsi tnyezje mindkt irnyban?
e. Vajon a (c) pontra adott vlasz azt sugallja-e, hogy a problmnak lehetsges olyan tfogalmazsa, hogy az
1-es llapotbl egy adott clllapothoz majdnem keress nlkl el tudnnk jutni?
3.9.
A hittrtk s kanniblok problmjt ltalban az albbi mdon szoks megadni. Hrom hittrt s hrom
kannibl egy foly azonos oldaln tartzkodik. Rendelkeznek csnakkal, amely egy vagy kt embert br el.
Talljuk meg annak a mdjt, hogy mindenkit a foly msik oldalra tjuttassunk, arra gyelve, hogy a
hittrtk soha, sehol ne legyenek kisebbsgben a kanniblokkal szemben. Ez a problma hres az MI-ben, mert
ez volt tmja az els olyan publikcinak, ahol a problmamegfogalmazst analitikus szemszgbl ksreltk
meg (Amarel, 1968).
a. Fogalmazza meg preczen a problmt. Csak azokat a megklnbztetseket tegye meg, amelyek a helyes
megolds rdekben szksgesek. Rajzolja fel a teljes llapottr diagramjt.
b. Implementlja s oldja meg optimlis mdon a problmt, megfelel keressi algoritmust vlasztva. J tlete az ismtld llapotok ellenrzse?
78
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
c. Vlemnye szerint mirt nehz e feladvny az emberek szmra, annak ellenre, hogy az llapottr ilyen
egyszer?
3.10.
Implementlja az llapottmenet-fggvny kt vltozatt a 8-as jtk szmra. Az egyik az sszes kvett
egyszerre generlja a 8-as jtk adatstruktrjnak msolsval s editlsval. A msik hvsakor, csak egy
kvett generl, a szl llapot kzvetlen mdostsval (s szksg esetn a mdostsok visszalltsval). rja
meg az iteratvan mlyl keress olyan vltozatait, amelyek a fggvny fenti vltozatait hasznljk, s
hasonltsa ssze a megoldsok hatkonysgt.
3.11.
A 4.5. szakasz - Iteratvan mlyl mlysgi keress rszben az iteratvan megnyl keresst (iterative
lengthening search) emltettk, amely az egyenletes kltsg keress iteratv vltozata. Az tlet az tkltsgre
vonatkoz nvekv korlt hasznlata. Egy jonnan generlt csompontot eldobunk, ha az tkltsge a korltnl
nagyobb. A kvetkez iterciban a korltot az elz iterciban eldobott csompontok kzl a legkisebb
tkltsgre lltjuk be.
a. Mutassa meg, hogy ez az algoritmus ltalnos tkltsgek esetn optimlis.
b. Tekintsen egy homogn ft b elgazsi tnyezvel, d megoldsmlysggel s egysgnyi lpskltsggel.
Hny itercira lesz szksge az iteratvan megnyl keressnek?
c. Most tekintsen egy olyan lpskltsget, amit a [0, 1] folytonos tartomnybl sorsolnak, egy minimlis
pozitv kltsggel. Hny itercira lesz szksg a legrosszabb esetben?
d. Implementlja az algoritmust s alkalmazza a 8-as jtk s az utaz gynk problma konkrt eseteire.
Hasonltsa ssze az algoritmus hatkonysgt az egyenletes kltsg algoritmus hatkonysgval, s
rtelmezze az eredmnyeit.
3.12.
Bizonytsa be, hogy az egyenletes kltsg keress s a szlessgi keress konstans lpskltsg mellett
optimlisak, ha azokat a GRF-KERESS algoritmusval egytt alkalmazzuk. Mutasson egy olyan llapotteret
vltoz lpskltsggel, ahol a GRF-KERESS algoritmus, iteratv mlylst hasznlva, csak egy szuboptimlis
megoldst tall.
3.13.
Adjon meg egy olyan keressi teret, amelyben az iteratvan mlyl keressi algoritmus a mlysgi keressnl
lnyegesen rosszabb teljestmnyt nyjt (pldul O(n2) az O(n)-nel szemben).
3.14.
rjon egy olyan programot, amely bementknt kt weblap URL-jt kapja meg, s megoldsul megtallja az
azokat sszekapcsol hivatkozsi utat (linkeket). Mi a megfelel keressi stratgia? J tlet-e a ktirny
keress? Alkalmazhat-e egy keresgp az eldcsompont fggvny megvalstsra?
3.15.
Gondolja vgig egy sk kt pontja kztti legrvidebb t megtallsnak a problmjt, ha a skon konvex
sokszg akadlyok tallhatk (lsd 3.22. bra). Ez annak a problmnak egy idealizlt vltozata, amivel egy
robotnak kell szembeslnie, amikor egy zsfolt krnyezetben kell naviglnia.
79
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
a. Tegyk fel, hogy az llapottr a sk sszes (x, y) pozcijbl ll. Hny llapotrl beszlhetnk ekkor? Hny
t vezet a clig?
b. Magyarzza el rviden, hogy egy sokszg cscst egy msikkal a skban sszekt legrvidebb tnak mirt
kell olyan egyenes vonalszakaszokbl llnia, amelyek az egyes sokszgek cscsait kapcsoljk ssze? Adjon
most egy j llapottr defincit. Milyen nagy ez a tr?
c. Definilja a keressi problma implementlshoz szksges fggvnyeket, belertve az llapottmenetfggvnyt, amely bemenetknt egy cscsot kap, s a belle egyenes vonalban elrhet cscsok halmazt adja
vissza (ne felejtsk ki a szomszdos cscsokat ugyanazon a sokszgn sem). Heurisztikus fggvnynek az
egyenes vonalbeli tvolsgot hasznlja.
d. Alkalmazzon a fejezetben ismertetett algoritmusok kzl egyet vagy tbbet a trgyterlethez tartoz
problmk megoldsra, s rtkelje azok teljestmnyt.
3.16.
A 3.15. feladat navigcis problmjt a kvetkezkppen transzformlja t egy krnyezetbe:
Az rzkels az gens ltal lthat sokszgcscsok az genshez viszonytott helyzetnek listja. Az rzkels
a robot pozcijt nem tartalmazza! A robotnak a sajt pozcijt a trkp alapjn kell megtanulnia. Azt is
ttelezzk fel ideiglenesen, hogy minden lokcinak eltr a panormja.
Minden cselekvs egy a kvetend egyenes utat ler vektor lesz. Ha az ton nincsenek akadlyok, a
cselekvs sikeres. Egybknt a robot azon a ponton megll, ahol az t az els akadlyt metszi. Ha az gens a
zrus mozgs vektort adja vissza s a clpozciban van (ami rgztett s ismert), akkor a krnyezetnek
teleportlnia kell az genst egy vletlen lokciba (de nem egy akadlyon bellre).
A hatkonysgi mrtk 1 pontot kr az genstl a megtett tvolsg minden egysgtvjrt s 1000 ponttal
djazza a cl mindenkori elrst.
a. Implementlja ezt a krnyezetet s egy erre a krnyezetre vonatkoz problmamegold genst. Minden
teleportls utn az gensnek j clt kell megfogalmaznia, belertve a sajt pozci felfedezst.
b. Dokumentlja az gens teljestmnyt (kommentlja az gens mozgst), s rjon egy jelentst az gens 100
epizdra vonatkoz teljestmnyrl.
c. Mdostsa a krnyezetet gy, hogy az gens az esetek 30%-ban ne a szndkolt helyen tallja magt (a helyet
a lthat sokszgcscsokbl sorsoljuk, ha van ilyen egyltaln, klnben nincs mozgs). Ez a vals robot
hibs mozgsnak egy durva modellje. Mdostsa genst gy, hogyha az ilyen hibt detektl, dertse ki, hol
van, s ksztsen tervet, hogy az eredeti pozciba visszakerlhessen, ahonnan az eredeti tervt folytatja.
80
Created by XMLmind XSL-FO Converter.
Problmamegolds keresssel
Emlkezzen arra, hogy nha az eredeti pozciba val visszatrs is kudarccal vgzdhet! Mutasson egy
olyan genst, amely kt egyms utni hibs mozgssal is sikeresen megbirkzik, s elri a clt.
d. Most kt klnbz visszalltsi smval ksrletezzen egy hiba megtrtnte utn: (1) induljon az eredeti t
legkzelebb es cscsa fel, s (2) tervezze t az utat a cl fel az j pozcibl kiindulva. Hasonltsa ssze a
hrom visszalltsi sma teljestmnyt. Meg fogja-e vltoztatni az sszehasonlts eredmnyt a keressi
kltsgek figyelembevtele?
e. Most ttelezze fel, hogy vannak lokcik azonos panormval (ttelezzk fel pldul, hogy a vilg egy
ngyzetrcs ngyzetes akadlyokkal). Milyen problmkkal kell most az gensnek szembenznie? Milyenek
most a megoldsok?
3.17.
A 1.1. szakasz - Jl definilt problmk s megoldsok rszben azt mondtuk, hogy nem trgyaljuk a negatv
tkltsggel rendelkez problmkat. Ennek a feladatnak a kapcsn rszletesebben megvizsgljuk a krdst.
a. Tegyk fel, hogy a cselekvseknek tetszlegesen nagy negatv kltsgk lehet. Magyarzza meg, hogy ez a
lehetsg mirt knyszert minden optimlis algoritmust a teljes llapottr felkutatsra.
b. Segteni fog-e, ha ragaszkodunk ahhoz, hogy a lpskltsg egy negatv c konstansnl nagyobb vagy azzal
egyenl legyen? Mind a fkra, mind a grfokra gondoljon.
c. Ttelezzk fel, hogy cselekvsek egy halmaza ciklust alkot gy, hogy a halmaz cselekvseit valamilyen
sorrendben vgrehajtva az llapot nem vltozik. Milyen kvetkezmnyekkel jr egy ilyen krnyezetben
tevkenyked gens optimlis viselkedsre, ha ezen cselekvsek mindegyike negatv kltsg?
d. Knnyen el tudunk kpzelni nagy negatv kltsg opertorokat mg az tkeressi problma esetn is.
Pldul nhny tszakasz olyan gynyr tjakon halad, hogy az id s zemanyag tekintetben messze
tlszrnyalja a norml kltsgeket. Pontos megfogalmazsban magyarzza el, hogy az emberek mirt nem
kocsikznak a vgtelensgig a szp tjak krl, s hogyan lehetne az tkeressi problmhoz az llapotteret
s az opertorokat definilni, hogy a mestersges gens is el tudja kerlni a ciklusokat.
e. Tud olyan valdi problmakrt mondani, amelyben a lpsek kltsge ciklust okoz?
3.18.
Gondoljon a Murphy-trvny uralma alatt ll ktlokcij, szenzor nlkli porszvvilgra. Rajzolja fel az {1,
2, 3, 4, 5, 6, 7, 8} kezdeti hiedelmi llapotbl elrhet hiedelem-llapotteret, s magyarzza meg, hogy a
problma mirt megoldhatatlan. Mutassa meg azt is, hogy ha a vilg teljesen megfigyelhet, minden kezdeti
llapotbl ltezik egy megoldsi szekvencia.
3.19.
Tekintse a 2.2. brn lthat porszvvilgot.
a. A fejezetben ismertetett algoritmusok kzl amelyik lenne alkalmas e problma megoldsra? Szksges-e,
hogy az algoritmus ellenrizze az ismtelt llapotokat?
b. A 3 3 vilgban alkalmazza a megvlasztott algoritmust az optimlis cselekvsi szekvencia kiszmtsra
egy olyan kezdeti llapottal, ahol a fels hrom ngyzet mindegyikben tallhat piszok, s az gens a
kzps ngyzetben tartzkodik.
c. ptsen keres genst, s rtkelje a teljestmnyt egy olyan 3 3 porszvvilg halmaz szmra, ahol
minden ngyzetben 0,2 a kosz valsznsge. A teljestmny mrsnl mind az tkltsget, mind a keressi
kltsget vegye figyelembe, egy rtelmes tszmtsi tnyezt hasznlva.
d. Hasonltsa ssze az eddigi legjobb keres gens viselkedst egy olyan egyszer, randomizlt reflexszer
gensvel, amely koszt szv, ha azt megtallja, klnben vletlen mdon mozog.
e. rtkelje, hogy mi trtnne, ha a vilgot n n-re nagytannk. Hogyan vltozna a keres s a reflexszer
gens teljestmnye n nvelsvel?
81
Created by XMLmind XSL-FO Converter.
Pldul Romniban az Arad s Bukarest kztti legolcsbb t kltsgt az Arad s Bukarest kztti
lgvonaltvolsggal meg lehetne becslni.
A heurisztikus fggvny a leginkbb megszokott mdja annak, hogy a problmra vonatkoz ptllagos tudst a
keressi algoritmusba be tudjuk injektlni. A heurisztikus fggvnyekkel rszletesen a 4.2. alfejezetben
foglalkozunk. Egyelre tetszleges, m problmaspecifikus fggvnyeknek fogjuk ket tekinteni, egy
1
2
A 4.3. feladatban azt krjk ntl, hogy mutassa ki, hogy ez a csald nhny jl ismert nem informlt keresst is tartalmaz.
A h(n) heurisztikus fggvny bemenete ugyan egy csompont, a fggvny rtke azonban a csomponthoz tartoz llapottl fgg.
82
Created by XMLmind XSL-FO Converter.
A 4.2. bra egy Aradrl Bukarestbe vezet t moh legjobbat-elszr keresst mutatja, hLMT-t alkalmazva.
Aradbl az els kifejtett csompont Nagyszeben, mert ez kzelebb van Bukaresthez, mint Nagyzernd vagy
Temesvr. A kvetkez kifejtend csompont pedig Fogaras, mert az van a legkzelebb. Fogaras majd generlja
Bukarestet, ami egyben a clllapot. Erre a konkrt problmra a hLMT -t alkalmaz moh legjobbat-elszr
keress gy tall megoldst, hogy soha sem fejt ki olyan csompontot, ami nem a megoldsi ton fekszik.
Kvetkezskppen minimlis a keressi kltsge. Azonban nem optimlis: a Nagyszebenen s Fogarason
keresztl Bukarestbe vezet t 32 kilomterrel hosszabb a Rimnicu Vilcen s Pitetin keresztl vezet tnl.
Ebbl ltszik, hogy az algoritmus mirt moh minden lpsben igyekszik annyira kzel kerlni a clhoz,
ahogy csak lehet.
4.2. bra - A moh legjobbat-elszr keress lpsei Bukarest esetn a lgvonalban mrt
tvolsgot (hLMT) alkalmazva. A csompontok a sajt h-rtkeikkel vannak felcmkzve.
A knyv els kiadsban ennek moh keress (greedy search) volt a neve. Ms szerzk ezt legjobbat-elszr keressnek (best-first
search) nevezik. A msodik vltozat ltalunk vlasztott ltalnosabb hasznlata Pearlt (Pearl, 1984) kveti.
3
83
Created by XMLmind XSL-FO Converter.
A h(n) minimalizlsa rzkeny a hibs kezd lpsekre. Tekintsk pldul azt az esetet, amikor Iairl
Fogarasra akarunk eljutni. A heurisztika alapjn Neamtot kellene elszr kifejteni, hiszen ez fekszik Fogarashoz
a legkzelebb, azonban ez zskutca. A megolds, hogy elszr elmegynk Vasluira egy olyan lpst tesznk,
ami a heurisztika szerint a cltl tvolabb visz s aztn elmegynk Csalnosra, Bukarestre, majd Fogarasra.
Ebben az esetben a heurisztika szksgtelen csompontok kifejtst eredmnyezi. Tovbb, ha nem gyelnk
arra, hogy felismerjk az ismtld llapotokat, akkor soha nem talljuk meg a megoldst a keress Neamt s
Iai kztt fog oszcilllni.
A moh legjobbat-elszr keress a mlysgi keressre hasonlt abbl a szempontbl, hogy egyetlen t
vgigkvetst preferlja a clig, azonban zskutcba jutva visszalp. Ugyanazokkal a problmkkal kszkdik,
mint a mlysgi keress nem optimlis s nem teljes (mert elindulhat egy vgtelen ton s soha sem tr vissza
jabb lehetsgeket kiprblni). A moh keress legrosszabb esetre szmtott (worst-case) id- s trignye
O(bm), ahol m a keressi tr maximlis mlysge. Jl megvlasztott heurisztikus fggvnnyel a komplexits
azonban jelentsen cskkenthet. A cskkens mrtke az adott problmtl s a heurisztikus fggvny
minsgtl fgg.
84
Created by XMLmind XSL-FO Converter.
gy amennyiben a legolcsbb megoldst keressk, sszer elszr a legkisebb g(n) + h(n) rtkkel rendelkez
csompontot kifejteni. Ezen stratgia kellemes tulajdonsga, hogy ez a stratgia tbb mint sszer: amennyiben
a h fggvny eleget tesz bizonyos feltteleknek, az A* keress teljes s optimlis.
Az A* optimalitst knny elemezni, ha az algoritmust a FA-KERESS-sel egytt alkalmazzuk. Ilyenkor A*
optimlis lesz, ha h(n) egy elfogadhat heurisztika (admissible heuristic), azaz ha h(n) soha nem becsli fell
a cl elrshez szksges kltsget. Az elfogadhat heurisztikk termszetkbl addan optimistk, mivel
gy gondoljk, hogy a problma megoldsa kisebb kltsggel jr, mint amekkora kltsget a megolds
valjban ignyel. Mivel g(n) az n csompont elrsnek pontos kltsge, azonnali kvetkezmnyknt addik,
hogy f(n) soha sem becsli tl az n csomponton keresztl vezet legjobb megolds valdi kltsgt.
Az elfogadhat heurisztikus fggvnyek taln egyik legnyilvnvalbb pldja a Bukarestbe trtn utazs sorn
felhasznlt hLMT lgvonalban mrt tvolsg. A lgvonalban mrt tvolsg elfogadhat, mert brmely kt pont
kztt a legrvidebb tvolsg a lgvonalban mrt tvolsg, gy a lgvonalbeli tv soha nem becslhet tl. A 4.3.
bra a Bukarestet keres A* fakeress elrehaladst mutatja. A g rtkeket a 3.2. brn lthat
lpskltsgekbl szmtjuk ki, a hLMT rtkei a 4.1. brn adottak.
Fontos
Vegyk szre, hogy Bukarest elszr az (e) lps peremben jelent meg, azonban kifejtsre nem kerlt,
mert Bukarest f-rtke (450) magasabb, mint Piteti (417). Ezt gy lehetne megmagyarzni, hogy
lehet, hogy Pitetin keresztl ltezik egy 417 kltsg olcs megolds, gy az algoritmus egy 450
kltsg megoldst nem fog vlasztani. Ebbl a pldbl megalkothatjuk annak az ltalnos
bizonytst, hogy a FA-KERESS-t hasznl A* algoritmus optimlis, ha h(n) elfogadhat. Tegyk fel,
hogy a peremen egy G2 szuboptimlis clcsompont jelenik meg, s az optimlis megolds kltsge
legyen C*. gy mivel G2 szuboptimlis s h(G2) = 0 (ami minden clllapotra igaz), tudjuk, hogy:
f(G2) = g(G2) + h(G2) = g(G2) > C*
Gondoljunk most egy perembeli n csompontra, amely a megoldsi tvonalon fekszik (ilyennek mindig lteznie
kell, ha a megolds ltezik). Ha h(n) nem becsli tl a megoldshoz vezet t folytatst, akkor tudjuk, hogy:
f(n) = g(n) + h(n) C*
Kimutattuk teht, hogy f(n) C* < f(G2), gy G2 nem kerl kifejtsre, s az A* egy optimlis megoldssal tr
vissza.
A bizonyts sszeomlik, ha a FA-KERESS helyett a 3.19. bra szerinti GRF-KERESS algoritmust hasznljuk.
Az algoritmus visszatrhet szuboptimlis megoldssal, mert a GRF-KERESS algoritmus elvetheti az ismtld
llapothoz vezet optimlis utat, ha az nem elsnek kerlt kiszmtsra (lsd 4.4. feladat). A problmt ktfle
mdon lehet megoldani. Az els megolds a GRF-KERESS olyan kiterjesztse, hogy az az ugyanahhoz a
csomponthoz vezet kt t kzl a drgbbat fogja elvetni (lsd az rtkelst a 3.5. alfejezetben). A ptllagos
adminisztrls nem egyszer, de az optimalitst garantlni fogja. A msodik megoldsnl azt kell biztostani,
hogy a brmelyik ismtld csomponthoz vezet optimlis t mindig az, amit az algoritmus elsnek kvet
mint ahogy ez az egyenletes kltsg keressnl volt. Ez a tulajdonsg akkor ll fenn, ha a h(n) fggvnyre
extra kvetelmnyeket fogalmazunk meg, megkvetelve annak konzisztencijt (consistency), mskppen
monotonitst (monotonicity). A h(n) heurisztikus fggvny konzisztens, ha minden n csompontra s annak
egy tetszleges a cselekvssel generlt minden n utdcsompontjra az n csomponttl elrt cl becslt
kltsge nem kisebb, mint az n -be kerls lpskltsge s az n csomponttl elrt cl becslt kltsge:
h(n) c(n, a, n) + h(n)
Ez az ltalnos hromszg egyenltlensg (triangle inequality) egy formja, amely azt fejezi ki, hogy egy
hromszg egy oldala sem lehet hosszabb, mint a kt msik oldal sszege. Itt a hromszget az n, az n s az nhez legkzebbi cl hatrozza meg. Knny megmutatni (4.7. feladat), hogy minden konzisztens heurisztika
egyben elfogadhat is.
85
Created by XMLmind XSL-FO Converter.
Fontos
A konzisztencia legfontosabb kvetkezmnye az, hogy: a GRF-KERESS-t hasznl A* algoritmus
optimlis, ha h(n) konzisztens.
86
Created by XMLmind XSL-FO Converter.
87
Created by XMLmind XSL-FO Converter.
Fontos
A konzisztencia egy msik fontos kvetkezmnye az, hogy ha h(n) konzisztens, akkor az f(n) rtkek
akrmilyen t mentn nem cskkennek. A bizonyts bizonyos a mellett kzvetlenl kvetkezik a
konzisztencia defincijbl. Tegyk fel, hogy n az n utdja, ekkor:
g(n) = g(n) + c(n, a, n)
s
f(n) = g(n) + h(n) = g(n) + c(n, a, n) + h(n) g(n) + h(n) = f (n)
A GRF-KERESS-t hasznl A* algoritmus ltal kifejtett csompontok sorozata teht f(n)-ben nem cskken. A
kifejtsre vlasztott els clcsompont gy egy optimlis megolds is egyben, mert minden utna kvetkez
csompont legalbb ilyen kltsges lenne.
Ha az f-kltsgek sohasem cskkenek, brmilyen utat vlasztunk, akkor az llapottrben hatrvonalakat
(contour) hzhatunk be, hasonlan egy topografikus trkp kontrjaihoz. A 4.4. bra erre mutat egy pldt. A
400-zal felcmkzett hatrvonalon bell az sszes csompont f(n) rtke nem nagyobb 400-nl, s hasonl
rvnyes a tbbire is. Mivel az A* keressi algoritmus a legkisebb f rtkkel rendelkez levlcsompontot fejti
ki elszr, lthatjuk, hogy az A* keressi algoritmus a gykrcsompontbl legyezszeren halad kifel,
nvekv f rtkekhez tartoz koncentrikus svokban hozzadva a csompontokat.
Az egyenletes kltsg keress esetn (A* keress h = 0 mellett) a csompontsvok a kiindul csompont kr
hzott koncentrikus krket alkotnak. Pontosabb heurisztikus fggvny alkalmazsval a svok a clllapot
fel elnylnak, s keskenyebben fkuszldnak az optimlis t krl. Ha C* az optimlis megoldsi t kltsgt
jelli, akkor az albbiakat jelenthetjk ki:
Az A* keressi algoritmus kifejti az sszes f(n) < C* rtkkel rendelkez csompontot.
Ezek utn az A* keressi algoritmus egy clcsompont kivlasztsa eltt mg kifejthet nhny csompontot a
clhatrvonalon, amelyekre f(n) = C*.
Intuitven nyilvnval, hogy az els megtallt megoldsnak optimlis megoldsnak kell lennie, hiszen a
kvetkez hatrvonalakon az sszes csomponthoz nagyobb f kltsg, ebbl addan nagyobb g kltsg
tartozik (mivel minden clllapotra h(n) = 0). Intuitven az is nyilvnval, hogy az A* keressi algoritmus teljes.
Ahogy egyre nvekv f rtk svokat adunk a keresshez, elbb-utbb elrnk egy svot, amelyhez tartoz f
rtk megegyezik egy clllapothoz vezet t kltsgvel.4
4.4. bra - Romnia trkpe. Az bra Arad mint kiindul llapot esetn az f = 380, f =
400 s f = 420 rtkekhez tartoz hatrvonalat mutatja. Egy adott hatrvonalon belli
csompontokhoz a hatrvonal rtknl kisebb f kltsg tartozik.
A teljessg megkvnja, hogy a C* kltsgnl kisebb vagy azzal egyenl kltsg csompontokbl vges sok legyen. Ez a felttel akkor
lesz igaz, ha minden lpskltsg egy vges -nl nagyobb s b vges.
4
88
Created by XMLmind XSL-FO Converter.
Vegyk szre, hogy az A* nem fejt ki f(n) > C* tulajdonsg csompontokat. A 4.3. brn pldul Temesvr nem
kerl kifejtsre annak ellenre, hogy ez a gykrnek egy utdcsompontja. Azt mondjuk, hogy a Temesvr alatti
ft lenyestk (pruned). Mivel hLMT elfogadhat, az algoritmus biztonsgosan figyelmen kvl hagyhat egy ilyen
ft, mikzben az optimalitst garantlja. A nyess gondolata a lehetsgek eliminlsa anlkl, hogy
megvizsglnnk azokat igen fontos az MI sok terletn.
Egy vgs szrevtel, az ilyen tpus a gykrbl kiindul utakat bvt optimlis algoritmusok kzl az A*
keressi algoritmus brmely adott heurisztikus fggvny mellett optimlis hatkonysg (optimally efficient).
Ez azt jelenti, hogy egyetlen ms optimlis algoritmus sem fejt ki garantltan kevesebb csompontot, mint az A*
(kivve taln az f(n) = C* tpus csompontok krt, ahol holtverseny alakulhat ki). Ez azrt van, mert az sszes
olyan algoritmus, amelyik nem fejti ki az sszes csompontot, melyre f(n) < C*, kockztatja az optimlis
megolds elkerlst.
Felettbb rmteli hr szmunkra, hogy az A* keressi algoritmus teljes, optimlis s az sszes ilyen jelleg
algoritmus kztt optimlisan hatkony. Sajnos ez azonban nem jelenti azt, hogy az A * algoritmus megoldja az
sszes keresssel kapcsolatos problmnkat. A buktat a dologban az, hogy a legtbb problma esetn a
csompontok szma a keressi tr clhatrvonalon belli rszn a megolds hossznak mg mindig
exponencilis fggvnye. Br az eredmny bizonytsa tlmutat ezen knyv keretein, megmutathat, hogy az
exponencilis nvekedssel mindenkpp szembe kell nznnk, kivve, ha a heurisztikus fggvnynk hibja
legfeljebb az aktulis tkltsg logaritmusval n. Az exponencilisnl lassabb nvekeds felttele matematikai
megfogalmazsban:
|h(n) h*(n)| O(log h*(n))
ahol h*(n) az n csompontbl a clcsompontba val eljuts valdi kltsgt jelli. Majdnem minden, a
gyakorlatban hasznlt heurisztikus fggvny esetn a hiba legalbb arnyos az tkltsggel, s az ebbl add
exponencilis nvekedssel egyetlen szmtgp sem tud megbirkzni. Ezrt ahhoz ragaszkodni, hogy egy
optimlis megoldst talljunk, gyakran nem is praktikus. Hasznlhatjuk az A* olyan vltozatt, amely a
szuboptimlis megoldsokat gyorsan megtallja, vagy pedig dolgozhatunk pontosabb, de nem elfogadhat
heurisztikkkal. Egy jl megvlasztott heurisztikus fggvny ettl fggetlenl a nem informlt keressi
algoritmusokhoz kpest jelents megtakartst eredmnyezhet. A 4.2. alfejezetben megvizsgljuk, hogy hogyan
is lehet j heurisztikus fggvnyt tervezni.
Az A* algoritmusnak azonban nem a szksges szmtsi id a nagy problmja. Mivel az sszes legenerlt
csompontot a memriban trolja (ahogy ezt az sszes GRF-KERESS algoritmus teszi), ezrt az algoritmus
ltalban lnyegesen hamarabb felemszti a rendelkezsre ll memrit, mintsem kifutna az idbl. Ezrt az
A* sok nagymret problmhoz nem praktikus. A kzelmltban kifejlesztett algoritmusok a vgrehajtsi id
89
Created by XMLmind XSL-FO Converter.
Az A*-hoz hasonlan az RLEK is optimlis algoritmus, feltve, hogy a h(n) heurisztikus fggvny elfogadhat.
Trkomplexitsa O(bd), az idkomplexitst azonban nehezebb meghatrozni. Ez fgg a heurisztika
pontossgtl s attl is, mennyire gyakran vltozik a csompontok kifejtse kzben a legjobb t. Mind az
IMA*, mind az RLEK elvileg ki vannak tve a grfokban val keresssel kapcsolatos exponencilis
90
Created by XMLmind XSL-FO Converter.
4.6. bra - Az RLEK lpsei, mikzben a legrvidebb utat keresi Bukarest fel. A
mindenkori rekurzv hvs f-korlt rtke a mindenkori aktulis csompont felett
lthat. (a) A Rimnicu Vilcen t vezet utat az algoritmus addig kveti, amg az
aktulis legjobb levl (Piteti) rtke nem lesz rosszabb, mint a legjobb alternatv t
rtke (Fogaras). (b) A rekurzi visszalp s az elfelejtett alfa legjobb levlrtkt (417)
Rimnicu Vilcenl feljegyezzk. Majd Fogaras kifejtse kvetkezik 450-nel, mint a
legjobb levlrtkkel. (c) A rekurzi visszalp. Az elfelejtett alfa legjobb levlrtkt
(450) Fogarasnl jegyezzk fel. Kvetkezik Rimnicu Vilcea kifejtse. Ezttal, mivel a
legjobb alternatv t (Temesvron keresztl) 447-be kerl, a kifejts folytatdik
Bukarest fel.
91
Created by XMLmind XSL-FO Converter.
A teljes algoritmus tlsgosan bonyolult, hogy itt rjunk rla, 5 azonban egy finom vonst rdemes megemlteni.
Azt mondtuk, hogy az EMA* a legjobb levelet fejti ki s a legrosszabb levelet felejti el. Mi van akkor, ha minden
levlnek ugyanaz az f-rtke? Az algoritmus ekkor ugyanazt a csompontot kifejtsre is, s elhagysra is
kivlaszthatn. Az EMA* ezt a problmt gy oldja meg, hogy a kifejtsre a legjabb csompontot vlasztja, s
a legrgebbi csompontot trli. Ez a kett ugyanaz a csompont csak akkor lehet, ha csak egy levl van. Ebben
az esetben az aktulis keressi fa egyetlen tbl ll a gykrtl a levlig, ami kitlti a teljes memrit. Ha a levl
nem egy clcsompont, akkor mg ha a clhoz vezet optimlis ton fekszik is, ez a cl az adott memrival
nem rhet el. Kvetkezskppen a csompontot ugyangy el lehet dobni, mintha nem is lenne kvetje.
Az EMA* teljes, ha van egyltaln elrhet megolds azaz ha D, a legseklyebb clcsompont mlysge
kevesebb, mint a memria nagysga (csompontokban kifejezve). Optimlis, ha van elrhet optimlis
megolds, mskppen az algoritmus a legjobb elrhet megoldssal tr vissza. Gyakorlatilag az EMA *-t messze
a legjobb ltalnosan hasznlatos algoritmusnak lehet tekinteni az optimlis megoldsok megkeressre,
klnskppen ha az llapottr egy grf, a lpskltsg nem egyenletes, s a csompontkifejts drga a nyitott
s zrt listk karbantartsnak ptllagos overheadjhez kpest.
Fontos
5
92
Created by XMLmind XSL-FO Converter.
2. Heurisztikus fggvnyek
Ebben a rszben a 8-as kirakjtkhoz keresnk heurisztikus fggvnyeket, hogy rvilgtsunk a heurisztikus
fggvnyek ltalnos termszetre.
A 8-as kirakjtk a legrgebbi heurisztikus keressi feladatok egyike. Mint azt a 3.2. alfejezetben lttuk, a jtk
lnyege, hogy a szmozott lapkkat vzszintesen s fgglegesen az res helyre tolva a kiindulllsbl a
clllsba jussunk (lsd 4.7. bra).
Egy tlagos megolds vletlen mdon generlt 8-as kirakjtk pldnyok esetn kb. 22 lpsbl ll. Az
elgazsi tnyez nagyjbl 3 (amikor az res lapka kzpen van, akkor ngy, amikor a sarokban van, akkor
kett, s amikor valamelyik szls kzps pozciban van, akkor pedig hrom mozgats lehetsges). Ebbl
addan egy 22 mlysgig men kimert keress kzeltleg 322 3,1 1010 llapotot vizsglna meg. Az
ismtld llapotok nyilvntartsval ezt a szmot 170 000-ed rszre le lehet cskkenteni, mert csak 9!/2 =
181 440 klnbz elrhet elrendezs ltezik (lsd 3.4. feladat). Ez egy kezelhet szm, azonban ugyanez a
szm a 15-s kirakjtk esetn mr durvn 1013, gy a kvetkez teend egy j heurisztika megkeresse.
Amennyiben a legrvidebb megoldsokat akarjuk megtallni A* bevetsvel, olyan heurisztikus fggvnyre van
szksgnk, ami soha sem becsli tl a clllapot elrshez szksges lpsek szmt. Az ilyen heurisztikk
keressnek a 15-s kirakjtk esetn nagy a mltja. me kt lehetsges fggvny:
h1 = a rossz helyen lv lapkk szma. A 4.7. brn a 8 lapkbl egyik sincs a helyn, gy a kiindul
llapotban h1 = 8 lenne. h1 elfogadhat heurisztikus fggvny, mivel nyilvnval, hogy minden rossz helyen
lv lapkt legalbb egyszer mozgatni kell.
h2 = a lapkknak a sajt clhelyeiktl mrt tvolsgaik sszege. Mivel a lapkkat nem lehet tlk mentn
mozgatni, az ltalunk kiszmtott tvolsg a vzszintes s fggleges tvolsgok sszege lesz. Ezt nha
hztmb- (city block distance) vagy Manhattan-tvolsgnak (Manhattan distance) is szoks nevezni. h2
szintn elfogadhat heurisztikus fggvny, mivel minden egyes mozgatssal egy lapkt csak egy lpssel
lehet kzelebb vinni a clhoz. A kiindul llapotban az 18 lapkkra szmtott Manhattan-tvolsg:
h2 = 3 + 1 + 2 + 2 + 2 + 3 + 3 + 2 = 18
Ahogy remltk, egyik sem becsli tl a megolds igazi kltsgt, ami 26.
93
Created by XMLmind XSL-FO Converter.
4.7. bra - A 8-as kirakjtk egy tipikus feladata. A megolds 26 lps hossz.
Pldul ha az A* algoritmus egy 5 mlysgben fekv megoldst 52 csompont kifejtsvel tall meg, akkor az
effektv elgazsi tnyez 1,92. Az effektv elgazsi tnyez a problmaesetek fggvnyben vltozhat,
megfelelen nehz problmk esetn azonban ltalban nagyjbl lland. gy a b* kisszm problmahalmazon
vgzett ksrleti mrse j fogdzt adhat a heurisztikus fggvny ltalnossgban vett hasznlhatsgrl. Egy
jl megtervezett heurisztikus fggvny effektv elgazsi tnyezje 1 krli rtk, ami lehetv teszi felettbb
nagy problmk megoldst is.
A h1 s a h2 heurisztikus fggvnyek tesztelshez vletlenszeren generltunk 1200 problmapldnyt, 224
mlysg megoldssal (100-100 pldnyt minden pros szm esetre), s megoldottuk azokat a h1 s a h2
heurisztikus fggvnyeket alkalmazva az A* fakeres algoritmussal, illetve a nem informlt iteratvan mlyl
keressi algoritmussal is. A 4.8. bra minden egyes stratgira megadja az tlagosan kifejtett csompontok
szmt s az effektv elgazsi tnyezt. Az eredmnyek azt mutatjk, hogy h2 jobb, mint h1, s hogy a nem
informlt keress mindkettnl sokkal rosszabb. A 14 hosszsg megoldsok esetn az A * h2-vel 30 000-szer
hatkonyabb, mint a nem informlt iteratvan mlyl keress.
94
Created by XMLmind XSL-FO Converter.
Feltehetjk magunknak a krdst, hogy vajon a h2 mindig jobb-e, mint a h1? A vlasz: igen. A kt heurisztikus
fggvny defincijbl jl ltszik, hogy minden n csompontra h2(n) h1(n). Azt mondjuk, hogy h2 dominlja
h1-et. A dominci kzvetlenl tvihet a hatkonysgra: a h2-t hasznl A* algoritmus kevesebb csompontot
fog kifejteni, mint a h1-et hasznl (taln csak az f(n) = C* tulajdonsg nhny csompontot kivve). Ezt az
albbi egyszer gondolatmenettel mutathatjuk meg. Idzzk fel a 1.2. szakasz - A* keress: a teljes becslt
tkltsg minimalizlsa rszben tett szrevtelnket, miszerint minden csompont kifejtsre kerl, amelyre f(n)
< C*. Ezzel egyenrtk az az llts, mely szerint minden csompont kifejtsre kerl, amelyre h(n) < C* g(n).
Mivel azonban h2 minden csompontra legalbb akkora, mint h1, gy minden olyan csompontot, amit kifejt a
h2-t alkalmaz A* algoritmus, kifejti a h1-et alkalmaz A* algoritmus is, de h1 alkalmazsa ms csompontok
kifejtst is okozhatja. Ebbl addan mindig jobb nagyobb rtkeket ad heurisztikus fggvnyeket
alkalmazni, amg nem becsljk tl a valdi kltsget, s a heurisztika szmtsi ideje nem tlsgosan nagy.
Fontos
Az olyan problmt, amelyben az opertorokra kevesebb megktst tesznk, mint az eredeti
problmban, relaxlt problmnak (relaxed problem) nevezzk. A relaxlt problma optimlis
megoldsnak kltsge egy elfogadhat heurisztika az eredeti problmra. A heurisztika elfogadhat,
mert az eredeti problma optimlis megoldsa definciszeren megoldsa a relaxlt problmnak is, s
gy legalbb olyan kltsges, mint a relaxlt problma optimlis megoldsa. Mivel a szmtott
heurisztika a relaxlt problmra egy pontos kltsg, teljestenie kell a hromszg egyenltlensget, s
ebbl kifolylag konzisztens 1.2. szakasz - A* keress: a teljes becslt tkltsg minimalizlsa
rszben.
95
Created by XMLmind XSL-FO Converter.
Az gy megkonstrult sszetett heurisztikus fggvny mindig azt a fggvnyt hasznlja, amelyik az adott
csompontra a legpontosabb. Mivel az alkotelemknt felhasznlt heurisztikus fggvnyek mind elfogadhatk,
ezrt h is elfogadhat. Ugyancsak knny bizonytani, hogy h konzisztens. Tovbb h dominlja az sszes,
benne alkotelemknt felhasznlt heurisztikus fggvnyt.
Elfogadhat heurisztikus fggvnyeket szrmaztathatunk az adott problma rszproblmjnak (subproblem)
megoldsi kltsgbl is. A 4.9. bra pldul a 4.7. brn lthat 8-as kirakjtk egy rszproblmjt mutatja.
A rszproblma lnyege az 1, 2, 3 s 4 lapkk helykre val mozgatsa. Vilgos, hogy e rszproblma optimlis
megoldsnak kltsge a teljes problma megoldsnak kltsgt alulrl korltozza. Bizonyos esetekben ez a
fggvny a Manhattan-tvolsgnl sokkal pontosabb.
A mintaadatbzisok (pattern databases) htterben hzd tlet az, hogy troljuk el az egyes
rszproblmaesetekhez tartoz pontos megoldsi kltsgeket ebben az esetben a ngy lapka s az res hely
minden konfigurcijhoz (jegyezzk meg, hogy a msik ngy lapka helye a rszproblma megoldsa
szempontjbl kzmbs, mozgsaik azonban a kltsgbe bele fognak szmtani). A problma teljes
llapothoz tartoz elfogadhat hAB heurisztikus fggvnyt ezek utn keress kzben gy szmtjuk ki, hogy a
megfelel rszproblma-konfigurcit az adatbzisbl kikeressk. Maga az adatbzis gy lett megtervezve,
hogy a clllapottl visszafel keresve minden j minta kltsgt feljegyeztk. Ennek a keressnek a kltsge a
sok egyms utn jv problmaesetre kivettve amortizldik.
A 8. s a 11. fejezetben erre a feladatra alkalmas formlis nyelveket runk le. Manipullhat formlis lersokkal a relaxlt problmk
konstrulsa automatizlhat. Egyelre termszetes nyelvet hasznlunk.
7
Vegyk szre, hogy a tkletes heurisztikt knnyszerrel megkaphatnnk, ha megengednnk h-nak a teljes szlessgi keress lefuttatst
stikban. A heurisztikus fggvny pontossga s szmtsi ideje kztt gy kompromisszumot kell ktni.
6
96
Created by XMLmind XSL-FO Converter.
4.9. bra - A 4.7. brn lthat 8-as kirakjtk eset egy rszproblmja. A feladat az,
hogy 1, 2, 3 s 4 lapkt a helyes pozcikba juttassuk el, nem trdve azzal, hogy a tbbi
lapkval mi fog trtnni.
Az 1-2-3-4 lapka megvlasztsa nyilvn tetszleges, az adatbzist az 5-6-7-8 s a 2-4-6-8 stb. lapkkra is meg
tudnnk konstrulni. Minden adatbzis egy elfogadhat heurisztikt szolgltat, s ahogy korbban
elmagyarztuk, ezen heurisztikkat kombinlni lehet, maximlis rtkkkel szmolva. Egy ilyen tpus
kombinlt heurisztika a Manhattan-tvolsgnl sokkal pontosabb. A 15-s kirakjtk vletlenszeren generlt
egyedeire a kifejtett csompontok szmt egy 1000-es tnyezvel lehet cskkenteni.
El lehetne tndni azon, hogy az 1-2-3-4 s az 5-6-7-8 adatbzisokbl kinyert heurisztikus fggvnyeket nem
lehetne-e sszeadni, mivel gy tnik, a kt rszproblmban nincs feds. A vlasz nemleges, mert egy adott
llapotban az 1-2-3-4 s az 5-6-7-8 rszproblmk megoldsai majdnem biztosan osztoznak kzs lpseken
igen valszntlen, hogy az 1-2-3-4 lapkkat a helykre el lehet mozdtani, anlkl hogy az 5-6-7-8-hoz ne
nylnnk hozz, s fordtva. s mi lenne, ha ezeket a lpseket nem is szmolnk be? Azaz nem az 1-2-3-4
rszproblma teljes kltsgvel szmolnnk, hanem csak az 1-2-3-4 lapka lpseit vennnk figyelembe. Knny
ilyenkor rjnni, hogy a kt kltsg sszege mg mindig a teljes problma megoldsi kltsgnek egy als
korltja. Ez a diszjunkt mintaadatbzis (disjoint pattern database) htterben hzd tlet. Az ilyen
adatbzisok hasznlatval lehetsgess vlik a 15-s kirakjtkot milliszekundumok alatt megoldani, a
Manhattan-tvolsghoz kpest a generlt csompontok szma egy 10 000-es tnyezvel kisebb. A 24-es
kirakjtk esetn kb. egymillis gyorstst lehet elrni.
A diszjunkt mintaadatbzisok jl mkdnek a csszlapka-jtkok esetn, mert a problmt gy lehet
felbontani, hogy egy-egy lps csak egy rszproblmra van hatssal, hiszen egyszerre csak egy lapkt
mozgatunk. A Rubik-kocka problmra ilyen bontst elvgezni nem lehet, mert minden mozgs 8, 9 vagy 26
kockt rint. Nem tudjuk egyelre, hogy az ilyen problmk szmra a diszjunkt mintaadatbzisokat hogyan
lehetne definilni.
A c1 s c2 konstansokat mdostani lehet, hogy a megoldsi kltsg aktulis adataira legjobban illeszkedjenek.
Felttelezheten c1-nek pozitvnak, c2-nek pedig negatvnak kellene lennie.
98
Created by XMLmind XSL-FO Converter.
A hegymsz keress illusztrlsra a 2.1. szakasz - Jtkproblmk bevezetett 8-kirlyn problmt (8queens problem) fogjuk hasznlni. A loklis keressi algoritmusok tipikusan a teljes llapot lerssal
(complete-state formulation) lnek, ahol minden llapotban a tbln 8 kirlyn helyezkedik el, oszloponknt
egy. Az llapottmenet-fggvny minden olyan lehetsges llapotot visszaad, amit gy kapunk, hogy egy
kirlynt ugyanabban az oszlopban egy msik mezre mozgatunk (gy minden llapotnak 8 7 = 56 kvetje
van). A h heurisztikus fggvny a kzvetlenl vagy kzvetett mdon egymst tmad kirlynprok szma. E
fggvny globlis minimuma 0, ami csak a tkletes megoldsban rhet el. A 4.12. (a) bra egy h = 17 rtk
99
Created by XMLmind XSL-FO Converter.
Loklis maximumok: egy loklis maximum egy cscs, amely minden szomszdjnl magasabb, de a
globlis maximumnl alacsonyabb. A hegymsz algoritmusok, ha egy loklis maximum kzelbe rnek,
knytelenek a cscs fel tartani, ott azonban nincs tovbb, s megakadnak. Ezt a problmt sematikusan a
4.10. bra mutatja. Konkrtabban, a 4.12. (b) bra llapota egy tnyleges loklis maximum (azaz egy loklis
minimum a h kltsgre nzve), brmely kirlyn brmilyen lpse csak ront a helyzeten.
Hegygerincek (ridges): egy hegygerincet a 4.13. bra mutat. A hegygerinc egy olyan loklis maximum
sorozatot eredmnyez, ahol egy moh algoritmusnak igen nehz naviglnia.
Fennsk (plateaux): a fennsk az llapottrnek egy olyan terlete, ahol a kirtkel fggvny gyakorlatilag
lapos. Lehet ez egy lapos loklis maximum, amelybl nincs tovbb felfel, de lehet egy vll (shoulder),
ahonnan mg lehetsges az elrehalads (lsd 4.10. bra). Egy hegymsz keress kptelen lehet arra, hogy
egy fennskrl megtallja a kivezet utat.
Az algoritmus minden esetben elr egy pontot, ahonnan mr nem tud tovbblpni. Egy vletlen mdon generlt
8-kirlyn llapotbl kiindulva a legmeredekebb emelked hegymsz algoritmus az esetek 86%-ban
megakad, a problmaeseteknek csupn 14%-t oldja meg. Az algoritmus gyorsan dolgozik, tlagosan 4 lpst
tesz, amikor sikerrel jr, s 3 lpst, amikor megakad. Ez egyltaln nem is olyan rossz a 8 8 17 milli llapotot
tartalmaz llapottrben.
A 4.11. bra algoritmusa megll, ha fennskra r, ahol a legjobb kvetnek is ugyanaz az rtke, mint az aktulis
llapotnak. Nem lenne-e j tlet mozgsban maradni oldallpseket (sideways move) megengedve annak
remnyben, hogy a fennsk igazbl egy vll, mint amilyent a 4.10. bra mutat? A vlasz ltalban igen,
azonban vatosan kell eljrnunk. Ha oldallpseket mindig megengednk, akkor ha felfel halads nincs,
vgtelen hurokba kerlnk minden olyan esetben, amikor az algoritmus olyan lapos loklis maximumot tall,
100
Created by XMLmind XSL-FO Converter.
4.13. bra - Annak illusztrlsa, hogy a gerinc mirt jelent nehzsget a hegymsz
keress szmra. Az llapotok rcshlzata (stt krk) r van illesztve a balrl jobbra
emelked gerincre, egy olyan loklis maximum sorozatot eredmnyezve, ahol a
maximumok nincsenek kzvetlen mdon egymssal sszekapcsolva. Minden egyes
loklis maximumbl az sszes lehetsges cselekvs a lejtn lefel mutat.
A hegymsz algoritmus szmos vltozatt fejlesztettk ki. A sztochasztikus hegymsz keress (stochastic
hill climbing) a felfel mutat irnyokbl vletlen mdon vlaszt. A vlaszts valsznsge a felfel mutat
irny meredeksgvel vltozhat. Az algoritmus ltalban a legmeredekebb emelked mdszernl lassabban
konvergl, egyes llapotfelszneken azonban kpes jobb megoldst tallni. Az elsnek-vlasztott hegymsz
algoritmus (first-choice hill climbing) sztochasztikus hegymsz keresst hasznl, a kvetket vletlen mdon
addig generlva, amg az az aktulis llapotnl nem lesz jobb. Ez j stratgia, ha egy llapotnak sok (pldul
tbb ezer) kvetje van. Ennek vizsglatra invitl a 4.16. feladat.
Az eddig lert hegymsz algoritmusok nem teljesek sokszor kudarcot vallanak a cl megkeressben, mert
egy loklis maximumba beragadnak. A vletlen jraindts hegymszs (random-restart hill-climbing) az
101
Created by XMLmind XSL-FO Converter.
4.14. bra - A szimullt lehts keressi algoritmus. A hegymsz keress egy olyan
vltozata, ahol lefel tart lpsek is megengedettek. A lefel tart lpseket a lehtsi
terv elejn inkbb, az id mlsval egyre kevsb fogadjuk el. A lehtsi terv, mint az
eljrs bemenete, a T rtkeit mint idfggvnyt adja meg.
Vletlen llapotot generlni egy implicit mdon specifiklt llapottrben azonban nmagban is igen kemny problma lehet.
Luby (Luby s trsai, 1993) azt bizonytotta be, hogy egyes esetekben az a legjobb, ha a vletlen keresst egy konkrt rgztett idtartam
letelte utn jraindtjuk, s ez sokkal hatkonyabb lehet annl, mintha mindegyik keresst a vgtelensgig hagynnk folytatdni. Az
oldallpsek kitiltsa vagy a szmuk korltozsa ennek egy pldja.
8
9
102
Created by XMLmind XSL-FO Converter.
A szimullt lehtsi algoritmust elszr elterjedten VLSI-elrendezsi problmk megoldsra hasznltk a 80as vek elejn. Azta szles krben alkalmazzk ipari termels temezsre s egyb nagy volumen
optimalizcis feladatokra. A 4.16. feladat a szimullt lehtsi algoritmus s a vletlen jraindts hegymsz
algoritmus teljestmnynek sszehasonltst kri az n-kirlyn problmn.
Fontos
Els ltsra a k llapot loklis nyalb keress nem tnik msnak, mint a k vletlen jraindts parallel
futtatsa a szekvencilis futtats helyett. Valjban a kt algoritmus igen klnbz. A vletlen
jraindts algoritmusban minden keressi folyamat a tbbitl fggetlenl fut le. A loklis nyalb
keressi algoritmusban a k parallel keressi szl megosztja az informcit. Pldul ha az egyik llapot
szmos j kvett generl, s a tbbi k 1 mind rosszabbat, akkor az eredmny az, mintha az els
llapot megzenn a tbbinek: Gyertek t ide, itt zldebb a f! Az algoritmus gyorsan abbahagyja az
eredmnytelen keresseket, s az erforrsait oda viszi, ahol a legnagyobb elrehalads rzkelhet.
A loklis nyalb keress a legegyszerbb formjban a k llapot kztti vltozatossg hinytl szenvedhet. Az
llapotok gyorsan koncentrldhatnak a tr egy kicsi rszben, amitl a keress csak kevssel lesz tbb, mint a
hegymsz keress egy drga vltozata. A problmt a sztochasztikus nyalb keress (stochastic beam
search) segti megoldani, ami analg a sztochasztikus hegymsz keresssel. A k legjobb kvet megvlasztsa
helyett az algoritmus a k kvett vletlen mdon vlasztja ki, ahol egy adott kvet kivlasztsnak
valsznsge az llapot rtknek nvekv fggvnye. A sztochasztikus nyalbkeress egy kicsit hasonlt a
termszetes kivlasztdsra, ahol egy llapot (szervezet) kveti (utdjai) a kvetkez genercit az llapot
rtke (fitness) alapjn npestik be.
10
A loklis nyalb keress a nyalbkeress (beam search) algoritmus egy adaptcija, ami viszont egy talap algoritmus.
103
Created by XMLmind XSL-FO Converter.
4.15. bra - A genetikus algoritmus. Az (a)-beli kezdeti populcit (b)-ben fitnessfggvny alapjn rangsoroljuk, aminek eredmnyt a (c)-ben lthat reprodukl
prok adjk. A ltrehozott utdok a (d)-ben lthatk, melyekre mg hat a mutci (e).
Az llapotok kvetkez genercijnak az ellltsa a 4.15. (a)(e) brn kvethet. A (b)-ben minden
llapotot a kirtkel fggvny vagy (GA-terminolgiban) a fitness-fggvny (fitness function) alapjn
rangsoroljuk. Egy fitness-fggvnynek a jobb llapotokra magasabb rtkeket kell visszaadnia, gy a 8-kirlyn
problmban fitness-fggvnyknt a nemtmad kirlynprok szmt hasznljuk. Ennek rtke egy megolds
esetn 28. A ngy llapot rtke 24, 23, 20 s 11. A genetikus algoritmus e konkrt vltozatban a szaporodsra
val kivlaszts valsznsge a fitness-rtkkel egyenesen arnyos. A szzalkos mennyisgeket a fitnessrtkek mellett adjuk meg.
A (c)-ben kt prt vletlenszeren vlasztunk ki reprodukcira, a (b)-beli valsznsgeknek megfelelen.
Figyeljk meg, hogy egy egyedet ktszer, egy msikat viszont egyszer sem vlasztottunk ki.11 Minden
keresztezend prnl egy keresztezsi (crossover) pontot vlasztunk a fzrbeli pozcik kzl. A 4.15. brn a
keresztezdsi pontok az els prnl a harmadik szmjegy utn, a msodik prnl az tdik szmjegy utn
vannak.12
4.16. bra - A 4.15. (c) brn lthat els kt szlnek s a 4.15. (d) brn lthat kt
utdnak megfelel 8-kirlyn llapotok. Az rnyalt oszlopok a keresztezds sorn
elvesznek, a nem rnyalt oszlopok megmaradnak.
A (d)-ben az utdok generlst ltjuk, a szl fzreket a keresztezsi pontoknl keresztezve. Az els pr els
gyereke pldul az els szltl az els hrom szmjegyt kapja s a msik szltl a tbbit. A msodik gyerek
Ennek a kivlasztsi szablynak szmos vltozata van. Kimutathat, hogy a selejtezs (culling) mdszere, ahol egy kszb al es minden
egyedet eldobunk, a vletlen vltozatnl gyorsabban konvergl (Baum s trsai, 1995).
12
Itt szmt a kdols. Ha a 8 szmjegyes kdols helyett a 24 bites kdolst hasznljuk, a keresztezdsi pontnak 2/3-ad eslye van, hogy
egy szmjegy belsejbe essen, ami ennek a szmjegynek lnyegben tetszleges mutcijt eredmnyezi.
11
104
Created by XMLmind XSL-FO Converter.
4.17. bra - Egy genetikus algoritmus. Ez az algoritmus ugyanaz, mint amelyet a 4.15.
brn mutattunk, egy kivtellel. Ebben a jobban elterjedt vltozatban a kt szl
reprodukcija nem kt, hanem csak egy utdot hoz ltre.
105
Created by XMLmind XSL-FO Converter.
Fontos
Evolci s keress
Az evolci elmlett Charles Darwin az On the Origin of Species by Means of Natural Selection c.
mvben (Darwin, 1859) dolgozta ki. A kzponti gondolat igen egyszer: a reprodukciban
(mutciknt ismert) eltrsek fordulnak el, s azokat a kvetkez genercik nagyjbl a
reprodukcis fitnessre gyakorolt hatsuk arnyban megtartjk.
A darwini elmletet annak ismerete nlkl dolgoztk ki, hogy a szervezetek tulajdonsgai hogyan
rkldnek s mdosulnak. E folyamatokat irnyt valsznsgi trvnyeket els zben Gregor
Mendel szerzetes azonostotta (Mendel, 1866), aki borsval ksrletezett, sajt szavaival mestersges
megtermkenytst alkalmazva. Sokkal ksbb Watson s Crick feltrtk a DNS-molekula szerkezett
s bcjt AGTC (adenin, guanin, timin, citozin) (Watson s Crick, 1953). A standard modellben a
betszekvenciban vltozs pontmutci s keresztezs rvn ll be (ahol az utd DNS-e a szli
DNS-ek hossz rszleteinek kombinlsval jn ltre).
A loklis keressi algoritmus analgijrl rtunk mr. A sztochasztikus nyalb keress s az evolci
kztti alapvet klnbsg a szexulis reprodukci hasznlata, ahol az utdokat tbb egyedbl hozzuk
ltre, s nem csak egybl. Az evolci tnyleges mechanizmusai azonban sokkal gazdagabbak, mint
amit a genetikus algoritmus lehetv tenne. A mutcihoz pldul az tfordts, a duplikls, a DNS
nagy szegmenseinek a mozgatsa is hozztartozik. Egyes vrusok a DNS-t az egyik szervezetbl veszik
s egy msik szervezetbe beillesztik. Vannak tvihet gnek is, amelyek nem tesznek mst, csak egy
gnllomnyon bell tbbezerszer lemsoljk magukat. Olyan gnek is vannak, amelyek a potencilis
reprodukcis partnereknl ezeket a gneket nem tartalmaz sejteket megmrgezik, nvelve gy a
sokszorozds eslyt. A legfontosabb tny, hogy maguk a gnek tartalmazzk annak a
mechanizmusnak a kdjt, amely ltal a gnllomny reprodukldik, s egy szervezett alakul t. A
genetikus algoritmusokban ezek a mechanizmusok klnll programok rszei, vagyis a manipullt
fzrekben nem jelennek meg.
A darwini evolci igencsak kis hatkonysg mechanizmusnak tnhet, hiszen vakon ltrehozott kb.
1045 szervezetet, anlkl hogy a keressi heurisztikin egy csppet is javtott volna. Darwin eltt 50
vvel a klnben neves francia termszettuds Jean Lamarck egy olyan evolci elmletet javasolt
(Lamarck, 1809), ahol egy szervezet az lete sorn, adaptcija rvn megszerzett tulajdonsgokat is
kpes az utdoknak tadni. Az ilyen mechanizmus hatkony lenne, de gy tnik, a termszetben nem
fordul el. Sokkal ksbb James Baldwin ltszlag hasonl elmlettel llt el (Baldwin, 1896), hogy a
szervezet lete alatt megtanult viselkeds nvelhetn az evolci sebessgt. Lamarck elmletvel
ellenttben a Baldwin-elmlet a darwini evolcival teljesen konzisztens, hiszen alapja egy szelekcis
13
106
Created by XMLmind XSL-FO Converter.
Egyes esetekben a maximumot a f = 0 egyenlet megoldsval tallhatjuk meg (ezt megtehetnnk pldul
akkor, ha csak egy replteret helyeznnk el; a megolds az sszes vros koordintinak szmtani kzepe lesz).
Sok esetben azonban ezt az egyenletet zrt alakban nem lehet megoldani. Hrom repltr esetn pldul a
gradiens kifejezse attl fgg, hogy az adott llapotban mely vrosok esnek legkzelebb az egyes
replterekhez. Ez azt jelenti, hogy a gradienst loklisan, s nem globlisan tudjuk szmtani. Ennek ellenre
mg mindig folyamodhatunk a legmeredekebb emelked hegymszshoz a pillanatnyi llapotot az
x x + (x)
kplettel frisstve, ahol egy kis konstans. Ms esetekben nem biztos, hogy a clfggvny differencilhat
formban ll a rendelkezsnkre pldul a replterek helyeit egy konkrt esetben esetleg egy nagymret
gazdasgi szimulcis szoftvercsomag futtatsval hatrozhatjuk meg. Az ilyen esetekben az n. empirikus
gradiens (empirical gradient) meghatrozshoz folyamodhatunk, minden koordinta mentn egy kis pozitv
s negatv vltozshoz kiszmtva a vlaszt. Az empirikus gradiens keress ugyanaz, mint a legmeredekebb
emelked hegymszs az llapottr diszkretizlt vltozatban.
Az egy kis konstans kifejezs mgtt az -t bellt mdszerek risi vlasztka rejlik. Az alapproblma az,
hogyha tl kicsi, tlsgosan sok lpsre van szksg. Ha tl nagy, a keress knnyszerrel tll a
maximumon. A vonalkeress (line search) mdszere e problmt gy ksrli megoldani, hogy a pillanatnyi
gradiens irnyt ltalban ismtelt megduplzsval meghosszabbtja, amg f nem kezd jra cskkeni. Az a
pont, ahol ez megtrtnik, lesz az j aktulis llapot.
Sok problma esetn a legjobb algoritmus a j reg NewtonRaphson-mdszer (Newton, 1671; Raphson,
1690). Ez a gykhelykeress, azaz a g(x) = 0 alak egyenletek megoldsnak ltalnos mdszere. Mkdsnek
alapja az x gyk j becslsnek szmtsa a Newton-formula szerint:
x x g(x)/g(x)
f maximumnak vagy minimumnak megkeresshez olyan x-et kell megkeresni, amire a gradiens nulla (azaz
f (x) = 0). A Newton-formula g(x)-e gy f (x) lesz, s a frisstsi egyenlete az albbi mtrixos formban
107
Created by XMLmind XSL-FO Converter.
Az online kifejezst srn hasznljk a szmtgpes tudomnyokban olyan folyamatok megjellsre, amelyek a bemeneti adatokat
azok bejvetelekor dolgozzk fel, s nem vrnak addig, amg a teljes bemeneti adathalmaz hozzfrhetv vlik.
14
108
Created by XMLmind XSL-FO Converter.
4.18. bra - Egy egyszer labirintusproblma. Az gens S-nl kezd s C-t kell elrnie, a
krnyezetrl azonban semmit sem tud.
109
Created by XMLmind XSL-FO Converter.
4.19. bra - (a) Kt olyan llapottr, amely az online keres genst egy zskutcba
viheti. (b) Egy ktdimenzis krnyezet, amely arra ksztetheti az online keres genst,
hogy a clhoz legkevsb hatkony utat kvesse. Akrmit is vlaszt az gens, az ellensg
eltorlaszolja az tjt egy msik hossz, vkony fallal gy, hogy a kvetett t sokkal
hosszabb lesz, mint a legjobb lehetsges t.
110
Created by XMLmind XSL-FO Converter.
Fontos
Lehet, hogy az esetleg megfogalmazst nem tallja kellen meggyznek vgl is ltezhetne olyan
algoritmus, amely feltrs kzben a zskutckban nem kt ki. A kijelentsnk pontosabban
megfogalmazva az, hogy nincs olyan algoritmus, amely brmilyen llapottrben el tudn kerlni a
zskutckat. Nzzk meg kzelebbrl a 4.19. (a) bra kt zskutcs llapottert. Egy olyan online
keres algoritmus szmra, amely az S s az A llapotokat mr megltogatta, a kt llapottr azonosnak
tnik, teht mindkettben ugyanolyan dntshez kell folyamodnia. Ez az ellensg rv (adversary
argument) egy pldja el tudunk kpzelni egy ellensget, amely mdostja az llapotteret, mikzben
az gens feltrja azt, s a clokat s a zskutckat tetszs szerint trendezi.
A zskutck a robotfeltrs igazi nehzsgei lpcshzak, felhajtk, szakadkok s a termszetes terep minden
fajtja irreverzbilis cselekvsekhez vezethetnek. Hogy elrehaladhassunk, egyszeren felttelezzk, hogy az
llapottr biztonsgosan feltrhat (safely explorable) bizonyos clllapotok az sszes elrhet llapotbl
elrhetk. A visszafordthat cselekvseket tartalmaz llapottereket, mint amilyenek a labirintusok s a
kirakjtkok, irnytatlan grfoknak lehet tekinteni, s nyilvn biztonsgosan feltrhatk.
Mg a biztonsgosan feltrhat krnyezetekben sem biztosthat korltozott kompetitv arny, ha lteznek
benne korltlan kltsg utak. Ezt knny kimutatni irreverzbilis cselekvseket tartalmaz krnyezetekben, de
igaz marad visszafordthat cselekvsek esetn is, ahogy ezt a 4.19. (b) bra mutatja. Emiatt ltalnos, hogy az
online algoritmusok hatkonysgt nem a legseklyebben fekv clllapot mlysgvel, hanem az egsz
llapottrrel jellemezzk.
4.20. bra - Egy mlysgi feltrst hasznl online keres gens. Az gens csak a
ktirny keressi terekben alkalmazhat.
111
Created by XMLmind XSL-FO Converter.
Egy online mlysgi keres genst a 4.20. bra mutat. Ez az gens a trkpt egy eredmny[a, s] tblzatban
trolja, amely az s llapotban vgrehajtott a cselekvs hatsra elll llapotot tartalmazza. Ha az aktulis
llapotban marad mg ki nem hasznlt cselekvs, az gens ezzel prblkozik. A nehzsg akkor ll be, ha az
gens egy llapotban mr minden cselekvst kiprblt. Offline mlysgi keressnl ezt az llapotot a sorbl
egyszeren elhagyjuk. Online keressnl az gensnek fizikailag kell visszalpnie. A mlysgi keressnl ez azt
jelenti, hogy abba az llapotba kell visszakerlnie, amelybl az gens legutbb belpett a vizsglt llapotba. Ezt
egy olyan tblzat karbantartsval lehet megoldani, amely minden llapot szmra azokat az sllapotokat
listzza, melyekhez az gens mg nem lpett vissza. A keress teljes, ha az gens a viszszalphet llapotokbl
kifut.
Azt javasoljuk, hogy az olvas kvesse vgig az ONLINE-MLYSGI-GENS elrehaladst a 4.18. brn
mutatott labirintus esetn. Knny szrevenni, hogy az gens a trben minden csatlakozst legrosszabb esetben
pontosan ktszer fog vgigpsztzni. Feltrs esetben ez optimlis eredmny. Egy cl megtallsa
szempontjbl azonban az gens kompetitv arnya tetszlegesen rossz lehet, ha egy hossz trra indul, holott
a cl a kezdeti llapot kzvetlen szomszdsgban fekszik. Ezt a problmt az iteratvan mlyl algoritmus
online vltozata oldja meg. Egy homogn ft eredmnyez krnyezetben egy ilyen gens kompetitv arnya egy
kis konstans.
Az alkalmazott visszalpsi mdszer miatt az ONLINE-MLYSGI-GENS csak olyan terekben mkdik, ahol
minden cselekvs visszafordthat. Az ltalnos llapotterekhez egy kicsit bonyolultabb algoritmusok lteznek,
azonban ezek egyike sem garantl korltozott kompetitv arnyt.
112
Created by XMLmind XSL-FO Converter.
Sokkal hatkonyabb megkzelts, ha a hegymszst nem vletlen mkdssel, hanem memrival ltjuk el. Az
alaptlet az, hogy a cl minden megltogatott llapotbl val elrsi kltsgnek egy H(s) aktulis legjobb
becslst eltroljuk. H(s) a h(s) heurisztikus becslsbl indul, s ahogy az gens egyre tbb tapasztalatot gyjt
az llapottrben, rtke folyamatosan frissl. A 4.22. bra egy egyszer pldt mutat egydimenzis llapottrre.
Az (a)-ban gy tnik, az gens egy lapos loklis minimumban, az rnyalt llapotban bennragadt. Ahelyett hogy
ott maradna, ahol volt, az gensnek kvetnie kellene azt az utat, ami a szomszdos llapotok aktulis
kltsgbecslsei alapjn a clhoz vezet legjobb tnak nz ki. Annak becslt kltsge, hogy a clt az s
szomszdon keresztl rjk el az s elrsnek kltsge, valamint a cl elrsnek becslt kltsge az s
llapotbl, azaz c(s, a, s) + H(s). A pldban kt cselekvs van, 1 + 9 s 1 + 2 becslt kltsgekkel,
legclszerbbnek tnik teht jobbra menni. Most vilgos, hogy az rnykolt llapot kltsgnek becslsre a
kettes rtk tl optimista. Mivel a legjobb cselekvs kltsge 1, s ez elvezet a cltl legalbb ktlpsnyire lv
llapothoz, az rnyalt llapot legalbb hromlpsnyire van a cltl. A H fggvnyt gy ennek megfelelen
frissteni kell, ahogy a 4.22. (b) bra mutatja. Ezt a folyamatot folytatva az gens mg ktszer mozdul el elrehtra, a H-t frisstve s a loklis minimumot lapostva, amg jobbra nem tud elmeneklni.
4.22. bra - A TRTA* t itercija egydimenzis llapottrben. Minden llapotot H(s)sel, a cl elrsnek aktulis becslsvel, s minden lt a lpskltsggel cmkztnk. Az
rnyalt llapot az gens helyt jelli meg, s a frisstett rtkeket minden iterciban
bekarikztuk.
A vgtelen eset sokkal trkksebb. A vletlen vndorls teljes egy- s ktdimenzis vgtelen rcsban, de nem a hromdimenzisban!
Ebben az utbbi esetben annak a valsznsge, hogy a vndorls valamikorra a kiindulpontba visszatr, csak 0,3405 krli. Egy ltalnos
bevezet: (Hughes, 1995).
15
113
Created by XMLmind XSL-FO Converter.
114
Created by XMLmind XSL-FO Converter.
6. sszefoglals
Ebben a fejezetben ttekintettk, hogyan lehet a keressi kltsget heurisztikus fggvnyek hasznlatval
cskkenteni. Megvizsgltunk szmos heurisztikus fggvnyt alkalmaz algoritmust, s lttuk, hogy az
optimalitsrt a keressi kltsg viszonylatban drga rat kell fizetnnk, mg akkor is, ha sikerlt j
heurisztikus fggvnyt tallnunk.
A legjobbat-elszr keress (best-first search) egyszeren egy olyan GRF-KERESS, ahol elszr
(valamilyen mrtk szerint) a legkisebb kltsg, mg ki nem fejtett csompontokat fejtjk ki. A legjobbatelszr algoritmusok tipikusan egy h(n) heurisztikus (heuristics) fggvnyt hasznlnak, amely a cl
kltsgt becsli az n llapotbl kiindulva.
A moh legjobbat-elszr keress (greedy best-first search) a minimlis h(n) rtk csompontokat fejti
ki. Nem optimlis, azonban sokszor hatkony.
Az A* keressi algoritmus (A* search) a minimlis f(n) = g(n) + h(n) rtk csompontokat fejti ki. Az A*
algoritmus teljes s optimlis, feltve, hogy garantlni tudjuk, hogy h(n) elfogadhat (a FA-KERESS szmra)
vagy konzisztens (a GRF-KERESS szmra). Az A* algoritmus trkomplexitsa mg mindig elfogadhatatlan.
A heurisztikus algoritmusok hatkonysga a heurisztikus fggvny minsgtl fgg. J heurisztikus
fggvnyek kszthetk nha pldul a problma defincijnak relaxlsval, a mintaadatbzis
rszproblmihoz tartoz megoldsi kltsgek elzetes kiszmtsval vagy a problmaosztlyon bell a
tapasztalatbl val tanulssal.
Az RLEK (RBFS) s az EMA* (SMA*) robusztus, optimlis keressi algoritmusok, amelyek korltozott
mennyisg memrit hasznlnak. Ha elegend id ll rendelkezsre, olyan problmkat is megoldanak,
melyeket az A* algoritmus nem kpes megoldani, mert elfogy a memrija.
A loklis keressi mdszerek, mint pldul a hegymsz keress (hill climbing) teljes llapotlersokkal
dolgoznak, de a memriban csak csekly szm csompontot tartanak. Tbb sztochasztikus algoritmust is
kifejlesztettek, belertve a szimullt lehtst (simulated annealing), amely megfelel htsi karakterisztika
esetn optimlis megoldssal tr vissza. A folytonos trbeli problmkra szmos loklis keressi algoritmus is
hasznlhat.
A genetikus algoritmus (genetic algorithm) egy olyan sztochasztikus hegymsz keress, ahol az llapotok
nagy populcijval dolgozunk. j llapotokat mutcival (mutation) s a populcibeli llapotprokat
sszekombinl keresztezssel (crossover) generlunk.
Felfedezsi problmkrl (exploration problems) akkor van sz, ha az gensnek fogalma sincs krnyezete
llapotairl s cselekvseirl. Biztonsgosan feltrhat krnyezetek esetn az online keres (online search)
gens felptheti a krnyezetek trkpt, s megtallja a clt, ha az ltezik. A heurisztikus becslsek
tapasztalat alapjn trtn frisstse hatkony mdszer, az gens loklis minimumokbl val
kimeneklshez.
115
Created by XMLmind XSL-FO Converter.
116
Created by XMLmind XSL-FO Converter.
6.2. Feladatok
4.1.
Kvesse vgig az A* mkdst a Lugasbl Bukarestbe utazs problmjra alkalmazva, lgvonalban mrt
tvolsg heurisztikt alkalmazva. Azaz adja meg az algoritmus ltal megvizsglt csompontok szekvencijt az
f-, g- s h-rtkkkel egytt.
4.2.
A heurisztikus talgoritmus (heuristic path algorithm) egy olyan legjobbat-elszr keress, ahol a
clfggvny f(n) = (2 w)g(n) + wh(n). Milyen w rtkekre garantlhat az algoritmus optimalitsa?
(Felttelezheti, hogy h elfogadhat.) Milyen keressrl van sz, amikor w = 0? Amikor w = 1? s amikor w = 2?
4.3.
Bizonytsa be az albbi lltsokat:
a. A szlessgi keress az egyenletes kltsg keress egy specilis esete.
b. A szlessgi keress, a mlysgi keress s az egyenletes kltsg keress a legjobbat-elszr keress
specilis esetei.
c. Az egyenletes kltsg keress az A* keress egy specilis esete.
4.4.
Tervezzen meg egy olyan llapotteret, ahol az A* a GRF-KERESS felhasznlsval egy szuboptimlis
megoldssal tr vissza egy elfogadhat, de nem konzisztens h(n) fggvny mellett.
4.5.
A 1.1. szakasz - A moh legjobbat-elszr keress rszben lttuk, hogy a lgvonalban mrt tvolsgheurisztika
a moh legjobbat-elszr keresst flrevezeti, amikor Iairl Fogarasra szerettnk volna eljutni. Az ellenkez
problmra azonban, vagyis amikor Fogarasrl Iaira szeretnnk eljutni, a heurisztika tkletes. Lteznek olyan
problmk, amelyek esetben a heurisztika mindkt irnyban flrevezet bennnket?
4.6.
Talljon ki a 8-as kirakjtkra olyan heurisztikus fggvnyt, ami nha tlbecsl, s mutassa meg, hogy egy
konkrt problma esetn ez hogyan vezethet szuboptimlis megoldshoz (hasznlhat szmtgpet, ha ez segt).
Bizonytsa be, hogy ha h soha nem becsl tl c-nl jobban, az A* algoritmus, h-t felhasznlva, olyan
megoldssal tr vissza, melynek kltsge az optimlis megolds kltsgt legfeljebb c-vel haladja meg.
4.7.
Bizonytsa be, hogy ha a heurisztikus fggvny konzisztens, akkor elfogadhat. Szerkesszen egy elfogadhat
heurisztikus fggvnyt, amely nem konzisztens.
4.8.
119
Created by XMLmind XSL-FO Converter.
120
Created by XMLmind XSL-FO Converter.
121
Created by XMLmind XSL-FO Converter.
5. fejezet - Knyszerkielgtsi
problmk
Ebben a fejezetben megmutatjuk azt, hogy ha az llapotokat nem egyszeren kis fekete dobozoknak tekintjk,
akkor j hatkony keressi mdszerek egsz sorhoz jutunk, valamint jobban megrtjk a problma struktrjt
s komplexitst.
A 3. s a 4. fejezetben azt az elkpzelst jrtuk krbe, hogy a problmkat llapottrbeli keresssel lehet
megoldani. A trgyterletre jellemz heurisztikk segtsgvel rtkelhetjk ezeket az llapotokat s
ellenrizhetjk, hogy nem jrunk-e clllapotban. A keressi algoritmus szempontjbl azonban mindegyik
llapot egy megklnbztets nlkli bels struktrj fekete doboz (black box). Az llapotokat egy
tetszleges adatstruktra reprezentlja, amelyhez a problmra jellemz rutinokkal lehet hozzfrni: az
llapottmenet- s a heurisztikafggvnnyel, valamint a clllapotteszttel.
A fejezetben a knyszerkielgtsi problmkkal (constraint satisfication problems) foglalkozunk, amikor az
llapotok s a clteszt illeszkedik egy szablyos, strukturlt s elg egyszer reprezentcihoz (lsd 5.1.
alfejezet). Az llapotstruktra segtsgvel keressi algoritmusokat lehet definilni, s nem problmaspecifikus,
hanem ltalnos cl heurisztikk hasznlatval nagy problmk megoldsa is lehetv vlik (lsd 5.2. s 5.3.
alfejezet). Taln a legfontosabb azonban az, hogy a clteszt szablyos reprezentcija feltrja magnak a
problmnak a struktrjt (lsd 5.4. alfejezet). Ez pedig mdszereket ad a keznkbe a problma
dekompozcijra, s lehetv teszi, hogy megrtsk a problma struktrja s a megolds nehzsge kztti
szoros kapcsolatot.
1. Knyszerkielgtsi problmk
A knyszerkielgtsi problmk (angol rvidtssel CSP) formlis defincijt vltozk (variables), X1, X2,
, Xn, s knyszerek (constraints), C1, C2, , Cm halmazaival adhatjuk meg. Minden egyes Xi vltoz esetn
adott a lehetsges rtkek egy nem-res Di tartomnya. Minden egyes Ci knyszer a vltozk valamely
rszhalmazra vonatkozik, s meghatrozza a rszhalmaz megengedett rtkkombinciit. Egy
problmallapotot az definil, hogy vagy nhny, vagy mindegyik vltozhoz rtkeket rendelnk hozz {Xi =
vi, Xj = vj, ...}. Egy hozzrendelst konzisztensnek (vagy megengedettnek) neveznk, ha egyetlen knyszert sem
srt meg. Teljes az a hozzrendels, amelyben mindegyik vltoz szerepel, s egy teljes hozzrendels a
knyszerkielgtsi problmnak megoldsa, ha mindegyik knyszert kielgti. Nhny knyszerkielgtsi
problma azt is ignyli, hogy a megolds egy clfggvnyt maximalizljon.
Mit is jelent mindez? Tegyk fel, hogy Romniba beleunva Ausztrlia trkpt tanulmnyozzuk, s a trkpen
az 5.1. (a) brn feltntetett llamokat s terleteket ltjuk, feladatunk pedig az, hogy vrssel, zlddel s
kkkel minden egyes rszt sznezznk ki gy, hogy a szomszdos rszeknek ne legyen azonos a szne. Ahhoz,
hogy ezt knyszerkielgtsi problmaknt fogalmazhassuk meg, vltozkat kell bevezetnnk az egyes
rszekhez: NyA, T, Q, DW, V, DA s T. Mindegyik vltoz tartomnya a {vrs, zld, kk} halmaz.
Knyszerek rjk el, hogy a szomszdos rszek klnbz sznek legyenek, pldul NyA s T esetn a
megengedhet kombincik az albbi prok lehetnek:
{(vrs, zld), (vrs, kk), (zld, vrs), (zld, kk), (kk, vrs), (kk, zld)}
Knyszerkielgtsi problmk
knyszerkielgtsi problmra rvnyes ltalnos mdon meg lehet rni. St ltrehozhatk hatkony, ltalnos
heurisztikk minden kiegszt, trgyterlet-specifikus szakrtelem nlkl. Vgl pedig a knyszergrf
struktrjnak segtsgvel lervidthet a megoldsi folyamat, s ez nhny esetben exponencilisan cskkenti
a problma komplexitst. A knyszerkielgtsi problma reprezentcija a legels (s a legegyszerbb) a
knyv menete sorn bemutatott reprezentcis smk sorban.
Knny szrevenni, hogy egy knyszerkielgtsi problmra adhat egy inkrementlis megfogalmazs
(incremental formulation), amely a knyszerkielgtsi problmt szablyos keressi problmaknt tekinti:
Kiindul llapot (initial state): az res hozzrendels {}, ahol egyik vltoznak sincs rtke.
llapottmenet-fggvny (successor function): brmelyik hozzrendels nlkli vltoz rtket kaphat,
amennyiben ez nem tkzik a korbbi rtkadsokkal.
Clteszt (goal test): az aktulis hozzrendels teljes.
Az t kltsge (path cost): egy konstans kltsg (pldul 1) mindegyik lpsre.
Fontos
Mindegyik megoldsnak egy teljes hozzrendelsnek kell lennie, teht n vltoz esetn az n-edik
mlysgi szinten jelenik meg. A keressi fa pedig csak n mlysg. Emiatt a korltkielgtsi
problmk esetn a mlysgi keressi algoritmusok npszerek (lsd 5.2. alfejezet). Az is igaz, hogy a
megoldshoz vezet t nem lnyeges. Ezrt hasznlhat a teljes llapotlers (complete-state
formulation) is, amelyben minden egyes llapot egy teljes vltoz-hozzrendels, akr kielgti a
knyszereket, akr nem. Ebben a felrsban a loklis keressi eljrsok is hasznlhatk.
A knyszerkielgtsi problmk legegyszerbb esetben a vltozk diszkrtek s vges tartomnyak. A
trkpsznezsi problmk is ehhez az esethez tartoznak. A 3. fejezetben bemutatott 8-kirlyn problmt is
felfoghatjuk vges tartomny knyszerkielgtsi problmaknt, ahol a Q1, , Q8 vltozk a kirlynk 1, , 8
oszlopokban betlttt pozciit jellik, s mindegyik vltoz tartomnya {1, 2, 3, 4, 5, 6, 7, 8}. Amennyiben
maximum d a knyszerkielgtsi problma brmely vltozjhoz tartoz tartomny mrete, akkor a lehetsges
teljes hozzrendelsek szma O(dn), azaz a vltozk szmnak exponencilis fggvnye. A vges tartomny
knyszerkielgtsi problmk kz tartoznak a Boole-problmk is, ahol a vltozk rtke vagy igaz, vagy
hamis. A Boole knyszerkielgtsi problmk specilis esetknt tartalmaznak nhny NP-teljes problmt,
pldul a 3SAT-ot (lsd 7. fejezet). Legrosszabb esetben teht nem lehetsges, hogy exponencilisnl kevesebb
id alatt meg tudunk oldani egy vges tartomny knyszerkielgtsi problmt. A legtbb gyakorlati
123
Created by XMLmind XSL-FO Converter.
Knyszerkielgtsi problmk
ahol X1, X2 s X3 a kvetkez oszlopba tvitt szmjegyet (0 vagy 1) reprezentl segdvltozk (auxiliary
variables). A magasabb rend knyszereket egy knyszerhipergrffal (constraint hyprergraph) lehet
brzolni, amelynek egy pldja az 5.2. (b) brn lthat. Az les szem olvasnak feltnhet, hogy a MindKl
knyszer felbonthat binris knyszerekre: F T, F U stb. Az 5.11. feladat ppen annak bizonytst kri,
hogy elegend segdvltoz bevezetsvel mindegyik magasabb rend vges tartomny knyszer trhat
binris knyszerek halmazv. Ebbl kiindulva ebben a fejezetben csak binris knyszerekkel foglalkozunk.
Az eddig emltett knyszerek mind abszolt knyszerek voltak: egy knyszer megszegse kizr egy
megoldsjelltet. A vals alkalmazsok sorn azonban sok knyszerkielgtsi problma tartalmaz
preferenciaknyszereket, melyek jelzik, hogy mely megoldsok preferltak. Egy egyetemi rarend
meghatrozsakor pldul X professzor taln inkbb reggel tantana, mg Y professzor a dlutni rkat
124
Created by XMLmind XSL-FO Converter.
Knyszerkielgtsi problmk
rszesten elnyben. Egy olyan rarend, amely szerint X professzornak dlutn kettkor kellene tantania, mg
megolds lenne (persze csak ha X professzor ppensggel nem a tanszkvezet), de ez nem lenne optimlis
megolds. A preferenciaknyszerek gyakran az egyedi vltoz-hozzrendelsek kltsgeknt brzolhatk:
pldul ha X professzor egy dlutni idpontot kap, az kt pontot ront az ltalnos clfggvnyen, mg a reggeli
raidpont csak egy pontba kerl. gy megfogalmazva a preferencikkal kiegsztett knyszerkielgtsi
problmk (tvonalalap vagy loklis) optimalizcis keressi mdszerekkel megoldhatk. Az ilyen
knyszerkielgtsi problmkkal a fejezetben tbbet nem foglalkozunk, de az irodalomjegyzkben megadunk
nhny kiindulsi pontknt hasznlhat hivatkozst.
5.2. bra - (a) Egy betrejtvny. Mindegyik bet klnbz szmjegyet jell, a rejtvny
clja olyan szmjegyeket helyettesteni a betk helyre, amelyekkel a kiadd sszeg
aritmetikailag helyes lesz (azzal a kln megktssel, hogy nem kezd nullk nem
megengedettek). (b) A betrejtvny knyszerhipergrfja a MindKl knyszer s az
oszloponknti sszeadsi knyszerek feltntetsvel. A knyszereket ngyzet alak
dobozok jellik. Minden doboz azzal a vltozval van sszektve, amelyre a doboz ltal
jelzett knyszer vonatkozik.
Fontos
Ltszlag racionlis, valjban naiv problmamegfogalmazsunk elhanyagolta az sszes
knyszerkielgtsi problma egy dnt kzs tulajdonsgt: a kommutativitst (commutativity).
Egy problma akkor kommutatv, ha a vgeredmny szempontjbl kzmbs, hogy cselekvsek egy
adott sorozatt milyen sorrendben alkalmazzuk. Ilyenek a knyszerkielgtsi problmk is, mert a
vltozk hozzrendelse sorn a sorrendtl fggetlenl ugyanazt a parcilis hozzrendelst kapjuk.
Ezrt teht mindegyik knyszerkielgtsi problmamegold a kvetkez llapot generlsakor a
keressi fa minden csompontjban csak egyetlen vltoz lehetsges hozzrendelseit veszi tekintetbe.
Az ausztrliai trkpsznezsi problma keressi fjnak gykrcsompontjban vlaszthatunk a DA =
125
Created by XMLmind XSL-FO Converter.
Knyszerkielgtsi problmk
5.4. bra - Rszlet a keressi fbl, amelyet az egyszer visszalpses keress generlt az
5.1. brn bemutatott trkpsznezsi problmhoz
A visszalpses keress (backtracking search) kifejezst olyan mlysgi keressekre hasznljuk, melyek
egyszerre csak egy vltozhoz rendelnek rtket, s visszalpnek, ha mr nincs megengedett hozzrendelsi
lehetsg. Az algoritmus az 5.3. brn lthat. Vegyk szre, hogy az algoritmus lnyegben a 115116.
oldalon lert egyenknti mdszert hasznlja az inkrementlis kvetkez llapot generlsra. Tovbb a
kvetkez llapot generlsakor kifejti az aktulis llapotot, nem pedig egyszeren msolja. A
knyszerkielgtsi problmk szoksos reprezentcija miatt nincs szksg a VISSZALPSES-KERESS
algoritmus kiegsztsre trgyterlet-specifikus kezdeti llapottal, llapottmenet-fggvnnyel vagy clteszttel.
Az 5.4. brn lthat egy rszlet az ausztrliai sznezsi problmhoz generlt keressi fbl (a vltozhozzrendelsek sorrendje NyA, T, Q, ).
Az egyszer visszalpses keress a 3. fejezet terminolgija szerint nem informlt algoritmus, teht nem is
vrjuk el, hogy nagy problmk esetn is hatkony legyen. Az 5.5. bra els oszlopban bemutatott nhny
eredmny megersti vrakozsainkat.
Knyszerkielgtsi problmk
A 4. fejezetben a nem informlt keressi algoritmusok gyenge teljestmnyt a problma ismeretbl szrmaz
trgyterlet-specifikus heurisztika bevezetsvel orvosoltuk. Az derl azonban ki, hogy a knyszerkielgtsi
problmk hatkonyan megoldhatk ilyen trgyterlet-specifikus tuds nlkl is. Olyan ltalnos cl eljrsok
alakthatk ki, amelyek az albbi krdseket vizsgljk:
1. A kvetkez lpsben melyik vltozhoz rendeljnk rtket, s milyen sorrendben prblkozzunk az
rtkekkel?
2. Milyen kvetkezmnyei vannak a jelenlegi vltoz-hozzrendelseknek a mg hozzrendeletlen vltozk
szmra?
3. Ha egy t sikertelennek bizonyul (azaz egy olyan llapothoz jutunk, ahol egy vltoznak nincs
megengedhet rtke), a kvetkez utak sorn el tudja-e kerlni a keress ezt a hibt?
A kvetkez pontokban megprbljuk sorra megvlaszolni ezeket a krdseket.
127
Created by XMLmind XSL-FO Converter.
Knyszerkielgtsi problmk
keressnl a teljestmny a problmtl fggen mintegy 33000-szer jobb lehet. Vegyk szre, hogy a
teljestmnymrtknk nem tartalmazza a heurisztikus rtkek kiszmtsnak tbbletkltsgt. A kvetkez
pontban bemutatunk egy mdszert, amellyel kezelhetv vlik ez a kltsg.
Az MRV-heurisztika semmit sem segt abban, hogy melyik rgit vlasszuk ki elsknt Ausztrlia
kisznezsekor, mert a kiindulskor mindegyik rginak hrom megengedett szne van. Ebben az esetben
segthet a fokszm-heurisztika (degree heuristics). Ez azltal ksrli meg a ksbbi vlasztsok elgazsi
tnyezjt cskkenteni, hogy azt a vltozt vlasztja ki, amely a legtbbszr szerepel a hozzrendeletlen
vltozkra vonatkoz knyszerekben. Az 5.1. brn DA a legnagyobb fokszm vltoz (fokszma 5), az sszes
tbbi vltoz fokszma 2 vagy 3, leszmtva T-t, amely nulla. Valjban, ha mr egyszer DA-t kivlasztottuk, a
fokszm-heurisztika alkalmazsa a problmt egyetlen hibs lps nlkl oldja meg: mindegyik vlasztsi
pontnl brmelyik konzisztens sznt is vlasztjuk, mindenkppen visszalps nlkl jutunk egy megoldshoz. A
legkevesebb fennmarad rtk heurisztika ltalban jobban irnyt, de a patthelyzetek eldntshez hasznos
segtsg lehet a fokszm-heurisztika.
Miutn az algoritmus mr kivlasztott egy vltozt, el kell dntenie, hogy milyen sorrendben vizsglja meg
ennek rtkeit. Erre nha a legkevsb-korltoz-rtk (least-constraining-value) heurisztika lehet hasznos.
Ez a heurisztika elnyben rszesti azt az rtket, amely a legkevesebb vlasztst zrja ki a knyszergrfban a
szomszdos vltozknl. Pldul tegyk fel, hogy az 5.1. bra esetben mr ltrehoztuk az NyA = vrs s az T
= zld parcilis hozzrendelst, s most Q szmra akarunk rtket tallni. A kk rossz vlaszts volna, mert ez
kizrja Q szomszdjnak, DA-nak utols megengedett rtkt. A legkevsb korltoz heurisztika ezrt a kkkel
szemben a vrset rszesti elnyben. ltalban vve a heurisztika megprblja a ksbbi vltozhozzrendelsek szmra a lehet legnagyobb szabadsgot meghagyni. Termszetesen ha egy problma sszes
megoldst meg szeretnnk tallni, s nem elgsznk meg csupn eggyel, akkor a sorrend kzmbs, hiszen
gyis minden rtknek sorra kell kerlnie. Ugyanez igaz akkor is, ha a problmnak nincsen megoldsa.
128
Created by XMLmind XSL-FO Converter.
Knyszerkielgtsi problmk
Az lkonzisztencia (arc consistency) alapul szolglhat egy gyors, az elrenz ellenrzsnl lnyegesen
ersebb knyszerterjesztshez. Az l itt a knyszergrf irnytott leit jelenti, amilyen pldul a DA-bl az
DW-be mutat l. Ha adott DA s DW aktulis tartomnya, akkor ez az l konzisztens, ha DA mindegyik x
rtkhez tallhat egy x-szel konzisztens valamilyen y rtk DW-ben. Az 5.6. bra harmadik sorban DA s
DW pillanatnyi tartomnya rendre a {kk}, illetve a {vrs, kk}. A DA = kk esetn tallhat egy konzisztens
hozzrendels DW-hez, nevezetesen az DW = vrs; ezrt a DA-bl DW-be mutat l konzisztens. Viszont
az DW-bl a DA-ba mutat l nem konzisztens, mert az DW = {kk} hozzrendelsnl a DA-hoz nem tudunk
sznt tallni. Az l gy tehet konzisztenss, hogy az DW tartomnybl trljk a kk rtket.
A DA-bl T-be mutat l mentn is alkalmazhatjuk a keressi folyamat ugyanazon fzisban az
lkonzisztencit. Az 5.6. bra harmadik sora szerint mindkt vltoz rtktartomnya {kk}. Ez azt
eredmnyezi, hogy trlnnk kell a kk-et DA tartomnybl, amely ezzel kirl. Az lkonzisztencia ellenrzs
teht lehetv teszi, hogy korbban szrevegyk az egyszer elrenz ellenrzs ltal fel nem fedett
inkonzisztencit.
Az lkonzisztencia-ellenrzs alkalmazhat elfeldolgoz lpsknt a keress megkezdse eltt, vagy a keressi
folyamat minden egyes hozzrendelst kvet terjesztsi lpsknt (az elrenz ellenrzshez hasonlan).
(Az utbbi algoritmust lkonzisztencia fenntartsnak is, angol rvidtssel MAC-nak nevezik.) Mindkt
esetben addig kell ismtelve alkalmazni a folyamatot, amg nem marad inkonzisztencia. Erre azrt van szksg,
mert amikor egy linkonzisztencit eltvoltand egy rtk kikerl egy vltoz tartomnybl, az ehhez a
vltozhoz mutat leknl j inkonzisztencia jhet ltre. Az AC-3, az lkonzisztencia teljes algoritmusa egy sort
hasznl annak nyilvntartsra, hogy mely lek inkonzisztencijt kell mg ellenriznie (lsd 5.7. bra). Minden
egyes (Xi, Xj) let sorban egyenknt levesszk a tennivalk listjrl s ellenrizzk; ha pedig Xi tartomnynak
brmely vltozjt trlni kell, akkor minden Xi -be mutat (Xk, Xi) let visszatesznk ellenrzsre a sorba. Az
lkonzisztencia-ellenrzs komplexitsa az albbiak szerint vizsglhat: egy binris knyszerkielgtsi
problmban legfeljebb O(n2) l van; minden egyes (Xk, Xi) l csak d alkalommal kerlhet napirendre, mert Xiben sszesen d trlhet rtk van; egy l konzisztencijnak ellenrzse elvgezhet O(d2) idben; teht a
legrosszabb esetben vett teljes id O(n2d3). Ez ugyan lnyegesen kltsgesebb, mint az elretekint ellenrzs,
de az extra kltsg ltalban kifizetdik.1
A Mohr s Henderson (Mohr s Henderson, 1986) bemutatta AC-4 algoritmus O(n2d2) alatt fut. (Lsd 5.10. feladat.)
129
Created by XMLmind XSL-FO Converter.
Knyszerkielgtsi problmk
Mivel a knyszerkielgtsi problmk specilis esetknt tartalmazzk a 3SAT-ot, ezrt nem vrhatjuk, hogy
polinom idej algoritmust tallunk annak eldntsre, hogy egy adott knyszerkielgtsi problma konzisztense. Ebbl arra kvetkeztethetnk, hogy az lkonzisztencia nem tr fel minden lehetsges inkonzisztencit.
Pldul az 5.1. brn az {NyA = vrs, DW = vrs} rszleges hozzrendels inkonzisztens, de az AC-3 nem
tallja meg. Definilhat a terjeszts ersebb formja is, amit k-konzisztencinak (k-consistency) neveznk.
Egy knyszerkielgtsi problma akkor k-konzisztens, ha brmely k 1 vltozbl ll halmaz s ezen
vltozk brmely konzisztens hozzrendelse esetn mindig lehet a k-adik vltoznak konzisztens rtket
tallni. Az 1-konzisztencia pldul azt jelenti, hogy mindegyik individulis vltoz nmagban vve is
konzisztens; ezt csompont-konzisztencinak (node consistency) is nevezik. A 2-konzisztencia ugyanaz, mint
az lkonzisztencia. A 3-konzisztencia azt jelenti, hogy egyms melletti vltozk brmely prja mindig
kiterjeszthet egy szomszdos vltozra; ezt tvonal-konzisztencinak (path consistency) is nevezik.
Egy grf ersen k-konzisztens akkor, ha k-konzisztens, valamint (k 1)-konzisztens, (k 2)-konzisztens s gy
tovbb le egszen az 1-konzisztenciig. Tegyk fel most, hogy van egy n csompontbl ll knyszerkielgtsi
problmnk, s tegyk ersen n-konzisztenss (azaz k-konzisztenss k = n esetben). Ekkor visszalps nlkl
megoldhatjuk a problmt. Elszr egy konzisztens rtket vlasztunk X1 szmra. Ezutn garancink van arra,
hogy tudunk X2 szmra rtket vlasztani, mert a grf 2-konzisztens, X3 szmra, mert a grf 3-konzisztens s
gy tovbb. Minden egyes Xi vltoz esetn csak d rtket kell ellenriznnk a tartomnybl, hogy egy X1 ,..., Xi
1-gyel konzisztens rtket talljunk. Garancink van teht arra, hogy O(nd) idben megoldst tallunk. Persze
semmit sem adnak ingyen: az n-konzisztencit biztost brmely algoritmus legrosszabb esetben n-ben
exponencilis lesz.
Az n-konzisztencia s az lkonzisztencia kztt egy szles kztes mez hzdik: az ersebb konzisztenciaellenrzsek futtatsa tovbb fog tartani, de tbb eredmnnyel jr az elgazsi tnyez cskkentsben s az
inkonzisztens rszleges hozzrendelsek feldertsben. Ki lehet szmolni a legkisebb olyan k rtket, melyre a
k-konzisztencia ellenrzsnek futtatsa visszalps nlkli problmamegoldst tesz lehetv (lsd 5.4.
alfejezet), de ez gyakran nem clszer. A legmegfelelbb konzisztencia-ellenrzsi szint kivlasztsa valjban
leginkbb empirikus tudomny.
Knyszerkielgtsi problmk
tartomny jn ltre, vagy tbb vltoznk marad, mint rtknk a tartomnyban, akkor egy inkonzisztencit
dertettnk fel.
Ezt a mdszert hasznlhatjuk arra, hogy az 5.1. bra {NyA = vrs, DW = vrs} rszleges hozzrendelsben
szrevegyk az inkonzisztencit. Figyeljnk fel arra, hogy a DA, az T s a Q vltozk lnyegben egy
MindKl knyszerrel vannak sszektve, mert mindegyik prnak klnbz sznnek kell lennie. Miutn
alkalmaztuk az AC-3-at a rszleges hozzrendelsre, az egyes vltozk tartomnya a {zld, kk} tartomnyra
szklt le. Azaz hrom vltoznk van s csupn kt sznnk, teht megszegtk a MindKl knyszert. Teht a
magasabb szint knyszerekre alkalmazott egyszer konzisztencia-ellenrzsek nha hatkonyabbak, mintha az
ekvivalens binris knyszerek halmazra vizsgltuk volna az lkonzisztencit.
A legfontosabb magasabb rend knyszer taln az erforrsknyszer (resource constraint), amit nha
legfeljebb knyszernek is neveznek. Jellje pldul PA1, ..., PA4 rendre ngy feladathoz hozzrendelt szemlyzet
szmt. Azt a knyszert, miszerint szszesen nem lehet 10-nl tbb embernek feladatot adni, gy rhatjuk fel:
legfeljebb(10, PA1, PA2, PA3, PA4). Az inkonzisztencit egyszeren ki lehet mutatni az aktulis tartomnyok
minimlis rtkeinek sszegzsvel: ha pldul mindegyik vltoz tartomnya a {3, 4, 5, 6}, akkor a legfeljebb
knyszert nem lehet kielgteni. A konzisztencit azltal is rvnyesthetjk, hogy trljk brmely tartomny
maximlis rtkt, amely nem konzisztens az sszes tbbi tartomny minimlis rtkvel. gy ha pldnkban
mindegyik vltoznak {2, 3, 4, 5, 6} a tartomnya, akkor az 5 s a 6 rtkeket mindegyik tartomnybl trlni
lehet.
A nagy erforrs-korltozott egsz rtk problmknl ilyenek pldul az emberek ezreit s jrmvek szzait
mozgat logisztikai problmk ltalban nem tehet meg az, hogy mindegyik vltoz tartomnyt egy nagy
egszhalmazzal brzoljuk, majd ezt a halmazt a konzisztencia-ellenrz mdszerek segtsgvel fokozatosan
cskkentjk. Ehelyett a tartomnyokat az als s a fels hatraikkal brzoljuk, s hatrterjeszts segtsgvel
kezeljk. Tegyk fel pldul, hogy kt repljrat van, a 271-es s a 272-es, amelyekre a replgpek
kapacitsa rendre 165 s 385. A repljrat utasszmnak kezdeti tartomnya teht
Jrat271 [0, 165] s Jrat272 [0, 385]
Tegyk fel most, hogy van egy kln korlt, miszerint a kt jratnak egytt 420 embert kell szlltania. Jrat271
+ Jrat272 [420, 420]. A hatrknyszereket terjesztve a tartomnyokat a kvetkezkre cskkentjk:
Jrat271 [35, 165] s Jrat272 [225, 385]
131
Created by XMLmind XSL-FO Converter.
Knyszerkielgtsi problmk
Fontos
A sasszem olvasnak valami furcsasg is feltnhetett: a visszaugrs akkor kvetkezik be, amikor egy
tartomny minden rtke konfliktusban van az aktulis hozzrendelsekkel, de az elrenz ellenrzs
felismeri ezt az esemnyt, s megakadlyozza, hogy valaha is ilyen csomponthoz jussunk! Valban,
meg lehet mutatni, hogy a visszaugrs ltal levgott minden gat az elrenz ellenrzs is levgja.
Teht az egyszer visszaugrs redundns az elrenz ellenrzs sorn, vagy pontosabban szlva, egy
olyan keressnl, amely ersebb konzisztencia-ellenrzst, pldul MAC-ot hasznl.
Az elz bekezds megfigyelse ellenre a visszaugrs mgtti tlet tovbbra is hasznlhat marad: lpjnk
vissza a hiba helyre. A visszaugrs akkor veszi szre a kudarcot, amikor egy vltoz rtktartomnya ress
vlik, de sok esetben egy g mr sokkal korbban levgsra lett tlve. Tekintsk ismt az {NyA = vrs, DW
= vrs} rszleges hozzrendelst (amelyik, korbbi megjegyzseink rtelmben, inkonzisztens). Tegyk fel,
hogy a T = vrs-t prbljuk, majd az T, Q, V, DA-kra alkalmazzunk hozzrendelseket. Tudjuk, hogy az
utbbi ngy vltoz esetn semmilyen hozzrendels sem lesz j, gy vgl T prblgatsnl kifogyunk az
rtkekbl. A krds most az, hogy hova lpjnk vissza? A visszaugrs nem fog mkdni, mert T-nek igenis
van az elz hozzrendelsekkel konzisztens rtke: T esetn nincsen teljes konfliktushalmaz a megelz
vltozk kztt, amely felels lenne a kudarcrt. Tudjuk azonban, hogy a ngy vltoz, T, Q, V, s DA
egyttvve a megelz vltozk egy halmaza miatt hisul meg, s ezek azok a vltozk, amelyek kzvetlenl
konfliktusban llnak a krdses nggyel. Ennek alapjn T konfliktushalmaznak egy mlyebb megrtshez
jutottunk: a konfliktushalmaz a megelz vltozk azon halmaza, ami brmely kvetkez vltozval egytt
felels T konzisztens megoldsnak kudarcrt. Esetnkben ez a halmaz az NyA s az DW, teht az
algoritmusnak DW-hez kell visszalpnie tugorva Tasmanit. A konfliktushalmaz ilyen defincijra
tmaszkod visszaugrsi algoritmust nevezzk konfliktusvezrelt visszaugrsnak (conflict-directed
backjumping).
Magyarzatot kell most adnunk arra, hogy miknt lehet kiszmtani ezeket az jfajta konfliktushalmazokat. A
mdszer valjban nagyon egyszer. Egy keressi g terminlsi kudarca mindig azrt kvetkezik be, mert
egy vltoz tartomnya kirl, ennek a vltoznak pedig egy szoksos konfliktushalmaza van. Pldnkban DA
hisul meg, s konfliktushalmaza (mondjuk) az {NyA, T, Q}. Visszaugrunk Q-ra, s Q bepti sajt kzvetlen
konfliktushalmazba (ami az {T, DW}) DA konfliktushalmazt (leszmtva persze Q-t magt), s gy elll
az {NyA, T, DW} konfliktushalmaz. Azaz Q-tl szmtva tovbb mr nincsen megolds felttelezve {NyA,
T, DW} korbbi hozzrendelseit. Teht visszalpnk T-re, amelyik a legutbbi ezek kzl. T felveszi
{NyA, T, DW} {T}-t a sajt kzvetlen konfliktushalmazba, {NyA}-ba, s elll az {NyA, DW}
konfliktushalmaz (ahogy az elz bekezdsben lltottuk). Foglaljuk ssze az eddig mondottakat: jellje Xj az
aktulis vltozt s conf(Xj) a sajt konfliktushalmazt. Ha Xj minden lehetsges rtke meghisul, ugorjunk
vissza a conf(Xj)-beli legutols Xi rtkre s legyen
conf(Xi) conf(Xi) conf(Xj) {Xi}
A konfliktusvezrelt visszaugrs a keressi fa megfelel helyre visz vissza, de nem akadlyozza meg, hogy
ugyanazt a hibt elkvessk a fa egy msik gn. A knyszertanuls (constraint learning) a konfliktusbl
kiemelt j knyszer megtanulsval mdostja a knyszerkielgtsi problmt.
Knyszerkielgtsi problmk
A loklis keress msik elnye az, hogy alkalmazhat online elrendezsben is, amikor a problma vltozik. Ez
klnsen fontos az temezsi problmkban. Egy lgitrsasg heti temezse jratok ezreit s emberekhez
rendelt feladatok tzezreit tartalmazhatja, de egy rossz idjrs az egyik repltren lehetetlenn teheti az
temezst. Ezt a lehet legkevesebb vltoztatssal szeretnnk helyrehozni, amit a jelenlegi temezsbl kiindul
loklis keressi algoritmussal vgezhetnk el knnyen. Egy visszalpses keress a knyszerek egy j
halmazval ltalban jval tbb idbe telik, s olyan megoldst is tallhat, amely jelentsen klnbzik az
aktulistl.
A loklis keress a clfggvny bevezetsvel knnyen kiterjeszthet egy knyszerkielgtsi problmv. Ebben az esetben a
hegymszsra s a szimullt lehtsre hasznlt sszes technika alkalmazhat a clfggvny optimalizlsra.
2
133
Created by XMLmind XSL-FO Converter.
Knyszerkielgtsi problmk
4. A problmk struktrja
Ebben az alfejezetben azt vizsgljuk meg, miknt lehet a problma struktrjt, ahogy azt a knyszergrf
megmutatja, felhasznlni a megoldsok gyors keressre. Az itt trgyalt megkzeltsek java rsze nagyon
ltalnos s a knyszerkielgtsi problmkon kvl ms eseteknl is alkalmazhat, pldul a valsznsgi
kvetkeztetsnl. Vgl is a rszproblmkk trtn dekompozci az egyetlen md, mellyel remlhetjk, hogy
megbirkzhatunk a valsvilg-beli problmkkal. Ismt rnzve az 5.1. (b) brra, mikzben a problma
struktrjt keressk, egy tny tlik a szemnkbe ki: Tasmania nincs sszekttetsben a nagy szrazflddel.3
Napnl vilgosabb, hogy Tasmania sznezse s a szrazfld sznezse fggetlen rszproblmk (independent
subproblems): a szrazfld sznezsnek brmely megoldsa s Tasmania sznezsnek brmely megoldsa
kombinlva egyben a teljes trkp sznezsnek is megoldsa lesz. A fggetlensgrl knny megbizonyosodni
a knyszergrf sszefgg komponenseit (connected components) vizsglva. Mindegyik komponens egy CSPi
rszproblmnak felel meg. Ha az Si hozzrendels egy megolds a CSPi rszproblmra, akkor az i Si
hozzrendels megoldsa lesz az i CSPi-nek. Mirt fontos ez? Gondoljunk bele a kvetkezbe: tegyk fel,
hogy minden egyes CSPi-nek c vltozja van az n-bl, ahol c konstans. Ekkor n/c rszproblmnk van, amelyek
mindegyike legfeljebb dc komplexits. Teht a teljes komplexits O(dcn/c), ami lineris n-ben, mg
dekompozci nlkl O(dn), ami exponencilis n-ben. Tegyk ezt mg konkrtabb: egy n = 80-nal jellemzett
Boole CSP-t ngy rszproblmv osztva (c = 20) a megolds futsi idejt a legrosszabb esetben is az
univerzum lethosszrl a msodperc trtrszre rvidtjk le.
Fontos
A teljesen fggetlen rszproblmk nyencfalatok, de ritkk. A legtbb esetben a knyszerkielgtsi
problmk rszproblmi kapcsolatban vannak egymssal. A legegyszerbb eset az, amikor a
knyszergrf egy ft alkot: brmely kt vltozt legfeljebb egy t kt ssze. Az 5.10. (a) bra egy
sematikus pldt mutat erre.4 Meg fogjuk mutatni, hogy brmely fastruktrj knyszerkielgtsi
problma megoldhat a vltozk szma szerinti lineris idben. Az algoritmusnak a kvetkez lpsei
vannak:
1. Vlasszuk ki brmelyik vltozt a fa gykrcsompontjul, s rendezzk a tbbi vltozt a gykrtl a
levelekig gy, hogy mindegyik csompontot a sorrendezsben megelzzn a szlje (lsd 5.10. (b) bra).
Cmkzzk ezeket a vltozkat sorban X1, , Xn-nel. Most, a gykrcsompontot leszmtva, mindegyik
vltoznak pontosan egy szlje van.
2. Alkalmazzuk az lkonzisztencit (Xi, Xj)-re, ahol Xi szlje Xj-nek (j pedig fusson visszafel n-tl 2-ig), s
szksg esetn vegynk ki rtkeket a TARTOMNY[ Xi]-bl.
Egy nagyon gondos trkpsz vagy egy tasmaniai patrita ellenvethetn, hogy Tasmanit nem lehet ugyanolyan sznnel sznezni, mint a
legkzelebbi szrazfldi szomszdjt, nehogy gy tnjn, mintha annak az llamnak a rsze lenne.
4
Sajnos nagyon kevs olyan terlete van a vilgnak (taln Celebesz ilyen), amelynek faszerkezet trkpe van. (Celebesz egy kzeltleg
csillagstruktrj sziget Kzp-Indonziban A ford.)
3
134
Created by XMLmind XSL-FO Converter.
Knyszerkielgtsi problmk
3. Adjunk Xj-nek brmilyen, Xi hozzrendelt rtkvel konzisztens rtket ahol Xi szlje Xj-nek, s j 1-tl n-ig
halad.
Kt dolog rdemes emltsre. Egyrszt a 2. lps utn a knyszerkielgtsi problma irny szerint
lkonzisztens, teht a 3. lps hozzrendelseiben nincsen szksg visszalpsre (lsd a k-konzisztencia
trgyalst a 2.2.2. szakasz - A knyszerek terjesztse rszben). Msrszt, miutn a 2. lpsben fordtott
sorrendben alkalmaztuk az lkonzisztencia-ellenrzseket, elrtk az algoritmussal, hogy a trlt rtkek ne
veszlyeztessk a mr feldolgozott lek konzisztencijt. A teljes algoritmus O(nd2) idben fut.
Most, hogy fkra mr van egy hatkony algoritmusunk, megvizsglhatjuk, miknt lehet az ltalnosabb
knyszergrfokat valahogyan fkra visszavezetni. Alapveten kt md van erre: az egyik a csompontok
eltvoltsn, a msik a csompontok sszevonsn alapul.
Az els megkzelts gy jr el, hogy nhny vltoznak rtket ad, a maradkok pedig ft fognak alkotni.
Vegyk ismt az 5.11. (a) brn lthat knyszergrfot az Ausztrlia-pldhoz. Ha trlni tudnnk DlAusztrlit, akkor a grf fv vlhatna (ahogy az bra (b) rszn lthat). Szerencsre meg tudjuk tenni ezt (a
grfban, nem a kontinensen) azzal, hogy DA rtkt rgztjk, s a tbbi vltoz tartomnybl trljk azokat
az rtket, melyek inkonzisztensek a DA szmra vlasztottal.
Most teht hogy mind DA-t, mind a r vonatkoz knyszereket eltvoltottuk, a knyszerkielgtsi problma
brmely megoldsa konzisztens lesz a DA szmra vlasztott rtkkel. (Ez binris knyszerkielgtsi
problmk esetn mkdik; a helyzet jval bonyolultabb magasabb rend knyszerek esetn.) Teht a keletkez
fa a fenti algoritmussal megoldhat, s gy az egsz problmt is megoldottuk. ltalnos esetben persze (nem
gy, mint a trkpsznezsnl) a DA szmra vlasztott rtk lehet rossz is, s ekkor egyesvel vgig kell
prblgatni ket. Az ltalnos algoritmus az albbi:
1. Vlasszunk ki egy S rszhalmazt a VLTOZK[csp]-bl gy, hogy a knyszergrf S eltvoltsa utn fa legyen.
S-et ciklikussg-vghalmaznak (cycle cutset) nevezzk.
2. S minden egyes vltozjnak minden egyes, az S-re vonatkoz sszes knyszert kielgt lehetsges
hozzrendelsre:
a. vegyk ki a fennmarad vltozk tartomnyaibl az S szmra vlasztott hozzrendelssel inkonzisztens
rtkeket, s
b. ha a fennmarad knyszerkielgtsi problmnak van megoldsa, akkor adjuk vissza ezt az S
hozzrendelsvel egytt.
Ha a ciklikussg-vghalmaz mrete c, akkor a teljes futsi id O(dc (n c)d2) lesz. Ha a grf kzel fa, akkor
c kicsi lesz, a megtakarts pedig tetemes a gondolkods nlkli visszalpses megoldshoz kpest. A
legrosszabb esetben azonban c akr (n 2) mret is lehet. A legkisebb ciklikussg-vghalmaz megtallsa
NP-nehz problma, de sok hatkony algoritmust ismernk erre a feladatra. Az ltalnos algoritmikus
megkzelts a vghalmaz-kondicionls (cutset conditioning); mg tallkozni fogunk ezzel a 14.
fejezetben, ahol a valsznsgekrl trtn kvetkeztetsekhez hasznljuk.
5.11. bra - (a) Az 5.1. brn szerepl eredeti knyszergrf. (b) A knyszergrf DA
eltvoltst kveten.
135
Created by XMLmind XSL-FO Converter.
Knyszerkielgtsi problmk
5.12. bra - Az 5.11. bra (a) rszn szerepl knyszergrf egy fa dekompozcija
136
Created by XMLmind XSL-FO Converter.
Knyszerkielgtsi problmk
Fontos
Egy adott knyszergrfnak tbb dekompozcija is lehetsges; a dekompozci kivlasztsakor az a cl,
hogy a rszproblmk a lehet legkisebbek legyenek. Egy grf fadekompozcijnak faszlessge (tree
width) eggyel kisebb, mint a legnagyobb rszproblma mrete; magnak a grfnak a faszlessge
pedig definci szerint a legkisebb faszlessg az sszes fadekompozcija kztt. Ha egy grfnak w a
faszlessge, s adott a megfelel fadekompozci, akkor a problmt meg lehet oldani O(ndw+1)
idben. Teht egy fellrl korltos faszlessg knyszergrffal rendelkez knyszerkielgtsi
problma polinomilis idben megoldhat. Sajnlatos mdon egy minimlis faszlessg
fadekompozci megtallsa NP-nehz problma, de vannak olyan heurisztikus mdszerek, amelyek
jl mkdnek a gyakorlatban.
5. sszefoglals
A knyszerkielgtsi problmk (CSP-k) vltozkbl llnak, melyekre knyszerek vonatkoznak. Nagyon
sok fontos valsvilg-beli problma rhat le knyszerkielgtsi problmaknt. A knyszerkielgtsi
problmk struktrja egy knyszergrffal reprezentlhat.
A visszalpses keress (backtracking search), a mlysgi keress egyik formja, a knyszerkielgtsi
problmk megoldsnak gyakran alkalmazott eszkze.
A legkevesebb fennmarad rtk (least-remaining value) heurisztika s a fokszm- (degree-)
heurisztika trgyterlet-fggetlen mdszerek annak eldntsre, hogy a visszalpses keress sorn melyik
vltozt vlasszuk ki kvetkeznek. A legkevsb korltoz rtk (least-constraining value) heurisztika
segtsgl szolglhat a vltozrtkek sorrendezsben.
A visszalpses algoritmus nagyban cskkenteni tudja a problma elgazsi tnyezjt a ltrehozott rszleges
hozzrendelsek kvetkezmnyeinek terjesztsvel. Erre a legegyszerbb mdszer az elrenz ellenrzs
(forward checking). Az lkonzisztencia (arc consistency) kiknyszerts egy jval nagyobb
teljestkpessg technika, de tovbb is tart a futsa.
137
Created by XMLmind XSL-FO Converter.
Knyszerkielgtsi problmk
Visszalpsre akkor kerl sor, amikor egy vltozhoz mr nem tallunk hozzrendelhet rtket. A
konfliktusvezrelt visszaugrs (conflict-directed backjumping) kzvetlenl a problma okhoz ugrik
vissza. A min-konfliktusok (min-conflicts) heurisztikt hasznl loklis keresst komoly sikerrel
alkalmaztk a knyszerkielgtsi problmkra.
A knyszerkielgtsi problma komplexitsa szorosan ktdik a sajt knyszergrfjnak struktrjhoz. A
fastruktrj problmk megoldhatk lineris idben. A vghalmaz-kondicionls (cutset conditioning)
az eredeti knyszerkielgtsi problmt fastruktrjv alakthatja, s nagyon hatkonynak bizonyul, ha
sikerl kis vghalmazt tallnunk. A fadekompozci (tree decomposition) technikk a knyszerkielgtsi
problmt rszproblmk fjv alakthatjk, s hatkonyak, ha a knyszergrf faszlessge (tree width)
kicsi.
Knyszerkielgtsi problmk
knyszerkielgtsi problmk megoldsnak komplexitsval. Apt (Apt, 1999) egy ltalnos algoritmikus
keretrendszert mutat be a konzisztenciaterjesztsi algoritmusok vizsglatra.
A magasabb rend knyszerek kezelsnek kln mdszerei elssorban a knyszerlogikai-programozs
(constraint logic programming) keretein bell alakultak ki. Marriott s Stuckey (Marriott s Stuckey, 1998)
nagyszer sszefoglalst nyjt errl a kutatsi terletrl. A MindKl knyszert Regin (Regin, 1994)
tanulmnyozta. Az als s fels hatrokbl ll knyszereket Van Hentenryck s trsai vezettk be a
knyszerlogikai programozsba (Van Hentenryck s trsai,1998).
Az alapvet visszaugr mdszer John Gaschnigtl (Gaschnig, 1977; 1979) szrmazik. Kondrak s van Beek
(Kondrak s Van Beek, 1997) megmutattk, hogy ezt az algoritmust lnyegben magban foglalja az elrenz
ellenrzs. A konfliktusvezrelt visszaugrst Prosser (Prosser, 1993) alaktotta ki. Az intelligens visszalps
legltalnosabb s legersebb formjt tulajdonkppen mr nagyon korn kifejlesztette Stallman s Sussman
(Stallman s Sussman, 1977). Technikjuk, a fggsgvezrelt visszalps (dependency-directed
backtracking) az igazsg-karbantart rendszerek (truth maintenance systems) kifejlesztshez vezetett
(Doyle, 1979), amelyekkel a 10.8. alfejezetben foglalkozunk. A kt terlet kzti kapcsolatot De Kleer (De
Kleer, 1989) vizsglta.
Stallman s Sussman munkja a knyszerfeljegyzs (constraint recording) elkpzelst is bevezette: a keress
ltal elrt rszleges eredmnyeket elmentjk s a keress sorn ksbb felhasznljuk. Ezt az elkpzelst a
visszalpses keressbe formlis mdon Dechter (Dechter, 1990a) vezette be. A visszajegyzs (backmarking)
(Gaschnig, 1979) egy klnlegesen egyszer mdszer, amelyben a konzisztens s inkonzisztens pronknti
hozzrendelseket elmentjk, hogy elkerljk a knyszerek ksbbi jraellenrzst. A visszajegyzs tvzhet
a konfliktusvezrelt visszaugrssal; Kondrak s Van Beek (Kondrak s Van Beek, 1997) bemutatnak egy hibrid
algoritmust, amely bizonythatan tartalmazza mindkt kln mdszert. A dinamikus visszalps (dynamic
backtracking) (Ginsberg, 1993) megrzi a vltozk ksbbi rszhalmazaibl szrmaz sikeres parcilis
hozzrendelseket, amikor egy olyan korbbi vlasztsi pontra ugrik vissza, amely a ksbbi sikert nem teszi
rvnytelenn.
A knyszerkielgtsi problmk loklis keresst Kirkpatrick s trsai (Kirkpatrick s trsai, 1983) szimullt
lehtsrl (simulated annealing) (lsd 4. fejezet) szl munkja tette npszerv, s ezt szles krben
alkalmaztk az temezsi problmknl. A min-konfliktusok heurisztikt elszr Gu (Gu, 1989) javasolta, s
tle fggetlenl Minton s trsai (Minton s trsai, 1992) is kifejlesztettk. Sosic s Gu (Sosic s Gu, 1994)
megmutatta, hogyan lehet ennek a heurisztiknak az alkalmazsval a 3 000 000-kirlyn problmt kevesebb,
mint egy perc alatt megoldani. A bmulatos siker, amit a min-konfliktusokat hasznl loklis keress rt el az nkirlyn problmban, a knny s a nehz problmk termszetnek s elterjedtsgnek jrartkelshez
vezetett. Peter Cheesman s trsai (Cheesman s trsai, 1991) feltrkpeztk a vletlenszeren generlt
knyszerkielgtsi problmk nehzsgt, s azt talltk, hogy majdnem minden ilyen problma vagy
trivilisan knny, vagy megoldhatatlan. Csak akkor tallunk nehz problma pldnyokat, ha a
problmagenertor paramtereit egy bizonyos szk tartomnyba lltjuk be, melyen bell a problmk
kzeltleg fele megoldhat. Ezzel a jelensggel a 7. fejezetben foglalkozunk rszletesebben.
A knyszerkielgtsi problmk struktrjnak s nehzsgnek kapcsolatval foglalkoz kutatst Freuder
(Freuder, 1985) indtotta el, aki megmutatta, hogy az lkonzisztens fk esetben a keress visszalpsek nlkl
fut le. Egy hasonl eredmny az aciklikus hipergrfokra val kiterjesztsvel egytt jtt ltre az adatbzisokkal
foglalkoz kutati kzssgben (Beeri s trsai, 1983). Ezen cikkek publiklsa ta komoly halads trtnt a
knyszergrf struktrja s a knyszerkielgtsi problma megoldsi komplexitsnak kapcsolatt illeten. A
faszlessg fogalmt a grfelmlettel foglalkoz Robertson s Seymour (Robertson s Seymour, 1986) vezettk
be. Freuder munkssgra ptve Dechter s Pearl (Dechter s Pearl, 1987, 1989) ugyanezt a fogalmat amit k
induklt szlessgnek (induced width) hvtak alkalmaztk a knyszerkielgtsi problmkra s
kifejlesztettk az 5.4. alfejezetben felvzolt fadekompozcit. Az adatbzis-elmletre s erre az eredmnyre
alapozva Gottlob s trsai (Gottlob s trsai, 1999a, 1999b) kialaktottk a knyszerkielgtsi problma
hipergrfknt trtn felfogsn alapul hiperfaszlessg (hypertree width) fogalmat. Annak megmutatsn
tl, hogy minden w szlessg hiperfa-CSP megoldhat O(nw+1logn) idben, azt is bebizonytottk, hogy a
hiperfaszlessg az sszes korbbi szlessg-mrtket magban foglalja (abban az rtelemben, hogy bizonyos
esetekben a hiperfaszlessg korltozott, bizonyos esetekben pedig nem).
Sok j ttekints ltezik a CSP-technikkhoz, pldul Kumar (Kumar, 1992), Dechter s Frost (Dechter s Frost,
1999) s Bartak (Bartak, 2001); tovbb a Dechter-tl (Dechter, 1992) s Mackworthtl (Mackworth, 1992)
szrmaz enciklopdiacikkek. Pearson s Jeavons (Pearson s Jeavons, 1997) a knnyen kezelhet CSPosztlyokat veszik szmba, belertve mind a strukturlis dekompozcis mdszereket, mind a maguknak a
139
Created by XMLmind XSL-FO Converter.
Knyszerkielgtsi problmk
5.2. Feladatok
5.1.
Fogalmazza meg a sajt szavaival a knyszerkielgtsi problmk, a knyszerek, a visszalpses keress, az
lkonzisztencia, a visszaugrs s a min-konfliktusok defincijt.
5.2.
Hny megoldsa van az 5.1. bra trkpsznezsi problmjnak?
5.3.
Magyarzza el, mirt j heurisztika a leginkbb korltozott vltozt s a legkevsb korltozott rtket
vlasztani a knyszerkielgtsi problma megoldsnak keresse kzben.
5.4.
Tekintsk a keresztrejtvnyek ksztsnek (nem megoldsnak) problmjt:5 szavakat kell illeszteni egy
ngyszgletes rcsba. A rcs, amely rsze a problma specifikcijnak, megadja, hogy mely ngyzetek
legyenek resek s melyek sttek. Tegyk fel, hogy adott a szavak egy listja (pldul egy sztr), s az a
feladat, hogy az res ngyzeteket a lista tetszleges rszhalmazt hasznlva kitltsk. Fogalmazza meg pontosan
ezt a problmt ktfle mdon:
a. Mint ltalnos keressi problmt. Vlasszon egy megfelel keressi algoritmust, s specifiklja a
heurisztikus fggvnyt (amennyiben elkpzelse szerint szksge van r). A fehr kockkba egyszerre egy
bett vagy egsz szavakat rdemes-e berni?
b. Mint knyszerkielgtsi problmt. A vltozk betk vagy szavak legyenek? Melyik megfogalmazst tartja
jobbnak? Mirt?
5.5.
Adjon precz megfogalmazst az albbiakra mint knyszerkielgtsi problmkra:
a. Ngyszgletes kirak: talljon nemtfed helyeket egy nagy ngyszgben kisebb ngyszgek szmra.
b. rarend-temezs: adott szm professzor s terem van, valamint rgztett az rarendi rk listja is a
lehetsges idablakokkal egytt. Mindegyik professzorhoz adott az ltala tartott rk halmaza.
5.6.
Oldja meg az 5.2. bra betrejtvnyt kzzel, visszalpses keresssel, elrenz ellenrzssel, valamint az
MRV-, illetve a legkevsb korltoz rtk heurisztikval.
5.7.
Az 5.5. bra a klnbz algoritmusokat az n-kirlyn problmn teszteli. Prblja meg ugyanezt egy
vletlenszeren generlt trkpsznezsi problmval is: osszon el az egysgskon vletlenszeren n pontot,
Ginsberg s trsai (Ginsberg s trsai, 1990) tbb mdszert trgyalnak keresztrejtvnyek ksztsre. Littman s trsai pedig a nehezebb
problmt, megoldsukat veszik clba (Littman s trsai, 1999).
5
140
Created by XMLmind XSL-FO Converter.
Knyszerkielgtsi problmk
vlasszon ki vletlenszeren egy X pontot, ksse X-et a legkzelebbi olyan Y ponthoz, amelyikkel X mg nincs
sszektve, s a vonal semelyik ms vonalat nem metsz; ismtelje a fenti lpst mindaddig, amg jabb
sszekttets mr nem lehetsges. Szmtsa ki a teljestmnytblzatot a legnagyobb n-re, amire csak tudja
(mind d = 3-at mind, d = 4-et hasznlva). Fzzn magyarzatokat a kapott eredmnyhez.
5.8.
Az AC-3 algoritmus felhasznlsval mutassa meg, hogy az lkonzisztencia alkalmas arra, hogy kimutassa az
5.1. bra {NyA = vrs, V = kk} parcilis hozzrendelsnek inkonzisztencijt.
5.9.
Mi a fastruktrj knyszerkielgtsi problmn futtatott AC-3 legrosszabb esetbeli komplexitsa?
5.10.
Az AC-3 visszarak a sorba minden (Xk, Xi) let, amikor Xi tartomnybl brmely rtket trltek, akkor is, ha Xk
minden rtke konzisztens Xi tbb fennmarad rtkvel. Tegyk fel, hogy minden egyes (Xk, Xi) lhez
nyilvntartjuk a fennmarad Xi rtkek szmt, amelyek az Xk minden egyes rtkvel konzisztensek.
Magyarzza el, hogyan lehet hatkonyan frissteni ezeket az rtkeket, s hogyan lehet ennek segtsgvel az
lkonzisztencit O(n2d2) lpsben elrni.
5.11.
Mutassa meg, hogy egy ternris knyszer, mint pldul az A + B = C egy segdvltoz bevezetsvel hrom
binris knyszerr alakthat. Felttelezheti, hogy a tartomnyok vgesek. (Segtsg: gondoljon egy olyan j
vltozra, amelynek rtkei ms rtkekbl ll prok, s gondoljon olyan knyszerekre, mint X az els eleme
az Y prnak.) Ezutn mutassa meg, hogyan lehet hasonlan kezelni a hromnl tbb vltozt tartalmaz
knyszereket. Vgl mutassa meg, miknt lehet kikszblni az unris knyszereket a vltozk tartomnynak
megvltoztatsval. Ez teljess teszi annak bizonytst, hogy brmely CSP talakthat olyan problmkk,
melyek csak binris knyszereket tartalmazhatnak.
5.12.
Olvasnival. Tegyk fel, hogy ismerjk egy grfrl, hogy van egy legfeljebb k csompontot tartalmaz
ciklikussg-vghalmaza. rjon le n vltozs CSP-k esetn egy egyszer algoritmust a minimlis ciklikussgvghalmaz megkeressre, ahol a futsi id maximuma O(nk). Vgezzen irodalomkutatst olyan vghalmazkeressi eljrsok utn, amelyek a vghalmaz mretben kzeltleg polinomilis idben tallnak kzeltleg
minimlis ciklikussg-vghalmazt. Praktikuss teszi az ilyen mdszerek ltezse a ciklikussg-vghalmaz
mdszereket?
5.13.
Tekintsk a kvetkez logikai rejtvnyt: t klnbz szn hzban t klnbz nemzetisg szemly l, s
mindegyikk ms mrkj cigarettt, ms italt s ms hzillatot szeret. Az albbi tnyek alapjn a
megvlaszoland krds a kvetkez: Hol lakik a zebra, s melyik hzban isznak vizet?
Az angol a vrs hzban lakik.
A spanyolnak kutyja van.
A norvg balrl az els hzban lakik.
A Kools cigarettt a srga hzban szvjk.
A Chesterfieldset szv ember a rks hz mellett lakik.
A norvg a kk hz mellett lakik.
A Winstont szv ember kgykat tart.
A Lucky Strike-ot szv narancslevet iszik.
141
Created by XMLmind XSL-FO Converter.
Knyszerkielgtsi problmk
142
Created by XMLmind XSL-FO Converter.
1. Ktszemlyes jtkok1
A 2. fejezetben tbbgenses krnyezeteket (multiagent environments) vezettnk be, ahol minden gensnek
szmolnia kell ms gensek cselekvseivel s azzal is, hogy azok hogyan befolysoljk a jltt. Ms gensek
nem megjsolhat viselkedse szmos lehetsges eshetsget (contingencies) visz be az gens
problmamegoldsba, ahogy ezzel a 3. fejezetben foglalkoztunk. A 2. fejezetben bevezettk a tbb gensbl
ll kooperatv (cooperative) s verseny- (competitive) krnyezeteket is. A versenykrnyezetek, ahol az
gensek cljai konfliktusban vannak, elvezetnek az ellensgek melletti keresshez (adversarial search) amit
sokszor ktszemlyes jtkoknak (games) neveznk.
A matematikai jtkelmlet (game theory) a gazdasgtan egyik ga, mely a tbbgenses krnyezeteket
jtknak tekinti, feltve, hogy egy-egy gens hatsa msokra szignifikns, fggetlenl attl, hogy az gensek
kooperatvak vagy versengk.2 Az MI-ben a jtkok ltalban igen specializltak amit a jtkelmleti
szakemberek determinisztikus, vltott lps, ktszemlyes, zrussszeg teljes informcij jtkoknak
(zero-sum games of perfect information) neveznek. A mi nyelvezetnkben ez azt jelenti, hogy kt gens
helyezkedik el egy determinisztikus s teljesen megfigyelhet krnyezetben, a cselekvseik vltjk egymst, s
a jtk vgn a hasznossgrtkeik mindig azonosak s ellenttes eljelek. A sakkban pldul, ha az egyik
jtkos gyz (+1), akkor a msik szksgszeren veszt (1). ppen a hasznossgrtkekben tapasztalt
ellentttl lesz a helyzet ellensges. Ebben a fejezetben rviden foglalkozunk a tbbjtkos jtkokkal, a nem
zrussszeg jtkokkal s a sztochasztikus jtkokkal, de a tnyleges jtkelmlettel csak a 17. fejezetben
fogunk foglalkozni.
A jtkok a civilizci kezdete ta nha mr ijeszt mrtkben foglalkoztatjk az emberek intellektulis
kpessgeit. A jtkok absztrakt termszetk miatt vonz terletet jelentenek az MI-kutatk szmra. Egy jtk
llst knny reprezentlni, s az gensek kpessgei ltalban kisszm, jl definilt eredmnyre vezet
cselekvsre korltozdnak. Az olyan fizikai jtkoknak, mint a krikett vagy a jgkorong, sokkal bonyolultabb a
lersa. Sokkal tbb lehetsges cselekvssel rendelkeznek, s a cselekvsek leglis voltt ppensggel nem tl
precz szablyok hatrozzk meg. A robotfutballt kivve e fizikai jtkok az MI-kzssgben sok rdekldst
nem keltettek.
A ktszemlyes jtkok az egyik legrgebbi, az MI ltal vizsglt terletet jelentik. 1950-ben, alighogy a
szmtgpek programozhatv vltak, Konrad Zuse (az els programozhat szmtgp s az els
programozsi nyelv megalkotja), Claude Shannon (az informcielmlet atyja), Norbert Wiener (a korszer
szablyozselmlet megteremtje) s Alan Turing elkezdtek sakkprogramokkal foglalkozni. Azta a jtkok
sznvonala sokat fejldtt, addig a szintig, hogy a gpek tlszrnyaltk az embert dmajtkban s Othellban,
megvertk (br nem minden alkalommal) ostblban s sakkban az emberi bajnokokat, s versenykpesek ms
jtkokban is. Kivtel a g, ahol a szmtgp csak amatr szinten jtszik.
A 3. fejezetben tanulmnyozott jtkproblmkkal ellenttben a ktszemlyes jtkok azrt rdekesek, mert
nagyon nehz ket megoldani. A sakknl pldul az tlagos elgazsi tnyez 35, s egy jtk sorn gyakran
elfordul, hogy mindkt fl 5050 lpst is megtesz, vagyis a keressi fnak 35100, illetve 10154 csompontja van
(br a keressi grfnak ebbl csak 1040 klnbz csompontja lesz). A jtkok, ppgy, mint a vals vilg,
azt a kpessget ignylik, hogy valamilyen dntst hozzunk, akkor is, ha az optimlis dnts kiszmtsa
kivitelezhetetlen. A jtkok nagyon komolyan bntetik a rossz hatkonysgot. Mg az A* algoritmus azon
implementcija, ami csak fele olyan hatkony, egyszeren csak ktszer annyi ideig fut, hogy megkapja az
eredmnyt, addig egy olyan sakkprogramot, amely feleolyan hatkonyan gazdlkodik az idejvel, feltve, hogy
minden ms szempontbl egy msik implementcival azonos, valsznleg a fldbe dnglnnek. A
Annak ellenre, hogy az angol game sz magyar sz szerinti fordtsa jtk, gy reztk, hogy az ilyen fordts magyarul sszemossa
a game s a toy kztti klnbsget. A ktszemlyes jtkok szhasznlat alkalmas kompromisszum, annak ellenre, hogy az ebben a
fejezetben trgyalt mdszerek olyan ktszemlyes jtkokra is kiterjeszthetk, ahol tbb jtkos van. (A ford.)
2
A nagyon sok gensbl ll krnyezeteket jobb gazdasgoknak (economies) s nem jtkoknak nzni.
1
143
Created by XMLmind XSL-FO Converter.
jtkelmleti kutats ezrt szmos rdekes tlethez vezetett, hogy a rendelkezsre ll idt hogyan hasznljuk a
lehet legjobb mdon.
A problma trgyalst az elmletileg lehetsges legjobb lps defincijval s ennek egy keresalgoritmusval
kezdjk. Ezek utn olyan technikkat nznk meg, amelyek korltozott id alatt is alkalmasak egy j lps
megvlasztsra. A nyess vagy metszs (pruning) lehetv teszi szmunkra, hogy figyelmen kvl hagyjuk a
keressi fa azon rszeit, amelyek nincsenek befolyssal a vgs vlasztsra. A heurisztikus kirtkel
fggvnyek (evaluation functions) lehetv teszik, hogy kimert keress nlkl meg tudjuk becslni egy adott
llapot valdi hasznossgt. A 6.5. alfejezet olyan ktszemlyes jtkokat trgyal, amelyekben a vletlen is
megjelenik, mint pldul az ostbla.3 Foglalkozunk a briddzsel is, amely tartalmazza a hinyos informci
(imperfect information) elemeit, hiszen egy-egy jtkos szmra az sszes krtya nem ismert. Megnzzk
vgl, hogy a jelenlegi legfejlettebb jtkprogramok hogyan gyzik le az ers emberi ellenfeleket, s milyenek a
jvbeli trendek.
Az ostbla (backgammon) Magyarorszgon nem annyira elterjedt, br szmos vidken ismert. A lnyege, hogy egy specilis tbln,
felvltva lpve, a bbukat az ellenfl trfelre juttassuk. F rdekessge, ami a nehzsgek forrsa is egyben, hogy a leglis lpsek
mindenkori vlasztka vletlenszeren egy kockadobsnak megfelelen alakul. (A ford.)
3
144
Created by XMLmind XSL-FO Converter.
A kezdeti llapot s mindkt fl leglis lpsei a jtk jtkfjt (game tree) definiljk. A 6.1. bra a 3 3-as
ambajtk keressi fjnak egy rszt mutatja. Kezdeti llapotban MAX-nak kilenc lehetsges lpse van. A
jtk sorn MAX s MIN felvltva tesznek X-et illetve O-t, mg egy vgllapotnak megfelel levlcsompontba el
nem jutnak, ahol az egyik jtkosnak egy sorban, egy oszlopban vagy az egy tl mentn hrom O-ja vagy X-e
lesz, vagy minden ngyzet ki lesz tltve. Az egyes levlcsompontok alatt tallhat szmok a vgcsompontnak
a MAX szempontjbl mrt hasznossgt jellik. A nagy rtkekrl felttelezzk, hogy jk MAX szmra s
rosszak MIN szmra (amibl a jtkosok neve is ered). MAX feladata, hogy a jtkft (s fleg a vgllapotok
hasznossgt) a legjobb lps meghatrozsra hasznlja fel.
Adott jtkfa mellett az optimlis stratgia meghatrozshoz az egyes csompontok minimax rtkt kell
megvizsglni, amit MINIMAX-RTK (n)-knt runk le. Egy csompont minimax rtke a csompont hasznossga
MAX szemszgbl, feltve, hogy innen kezdve egszen a jtk befejezsig mindkt jtkos optimlisan lp.
Egy vgllapot minimax rtke termszetesen a sajt hasznossga. Tovbb, adott minimax rtkek mellett, MAX
szeretne a maximlis rtk, MIN pedig a minimlis rtk llapotba jutni. Rendelkeznk teht az albbi
fggvnnyel:
MINIMAX-RTK (n) =
HASZNOSSG (n)
ha n egy vgllapot,
Alkalmazzuk ezeket a defincikat a 6.2. brn lthat jtkfra. Az bra aljn lv clllapotokat mr
felcmkztk hasznossgi rtkkkel. Az els, B cmkj, MIN csompontnak hrom kvetje van 3, 12 s 8
rtkkel, a B csompont minimax rtke teht 3. Hasonlan a kt msik MIN csompontnak 2 a minimax rtke.
A gykr egy MAX csompont; a kvetinek minimax rtkei 3, 2, s 2, gy a gykr minimax rtke 3.
Azonosthatjuk a gykr minimax dntst (minimax decision) is. MAX szmra az a1 cselekvs az optimlis
vlaszts, mert maximlis rtk kvethz vezet.
Ezen optimlis jtkdefinci MAX szmra felttelezi, hogy MIN is optimlisan jtszik hiszen a dolgok
kimenetelt MAX szmra a legrosszabb esetre kivettve maximalizlja. Mi van azonban, ha MIN nem jtszik
optimlisan? Ekkor knny beltni (6.2. feladat), hogy MAX mg jobban jr. Szuboptimlis ellenfllel szemben
sok stratgia elkpzelhet, amely az optimlisnl jobb, azonban ezek a stratgik rosszabbnak fognak bizonyulni
optimlis ellenfelekkel szemben.
146
Created by XMLmind XSL-FO Converter.
A minimax algoritmus a jtkfa teljes mlysgi feltrst vgzi. Ha a fa maximlis mlysge m, s minden
csompontban b leglis lps ltezik, akkor a minimax algoritmus idkomplexitsa O(bm). A trkomplexitsa
O(bm) egy olyan algoritmus szmra, amely az sszes kvett egyszerre szmtja ki, s O(m) egy olyan
algoritmus esetben, amely a kvetket egyenknt generlja 4.3. szakasz - Mlysgi keress. Vals jtkok
esetn ez az idkomplexits az algoritmust teljesen haszontalann teszi, az algoritmus azonban j alap a jtkok
matematikai elemzshez s a gyakorlati szempontbl alkalmasabb algoritmusokhoz.
147
Created by XMLmind XSL-FO Converter.
6.4. bra - Hrom jtkos (A, B, C) jtkfja a hrom els fl lps esetn. Minden
csompontot az sszes jtkos szemszegbl szmtott rtkkel cmkztk meg. A
legjobb lpst a gykrnl jelltk be.
Mindenki, aki olyan tbbszemlyes jtkokat jtszik, mint pldul a Diplomacy, gyorsan meggyzdhet, hogy
a ktszemlyes jtknl sokkal tbbrl van itt sz. Tbbszemlyes jtkban a jtkosok kztt ltalban
lehetsgesek formlis vagy informlis szvetsgek (aliances). A jtk elrehaladtval szvetsgek kttetnek s
bontatnak fel.
Hogyan is kellene rtelmezni egy ilyen viselkedst? Termszetes kvetkezmnye-e a szvetsg az egyes
jtkosok optimlis stratgiinak egy tbbjtkos jtkban? gy tnik, hogy ez igaz lehet. Tegyk fel pldul,
hogy A s B gyengn, mg C ersebben ll. Akkor nha optimlis mind A, mind B szmra, ha nem egymst,
hanem C-t tmadjk meg, hogy az egyenknt ne vgezzen velk. Ily mdon az egyttmkds tisztn egoista
viselkedsbl is kialakulhat. Persze ahogy az egyttes tmadsnak kitett C gyengl, a szvetsg rtke cskken,
s vagy A, vagy B a megegyezst megszegheti. Egyes esetekben az explicit szvetsgek az gyis
bekvetkezend esemnyeket rgztik konkrt mdon. Ms esetekben szocilis megblyegzs jr a szvetsg
megszegsrt, gy a jtkosnak mrlegelnie kell a szvetsg megszegsnek rvid idej elnyt s a
szavahihetetlenknt val megblyegzs hossz tv htrnyt. (Az ilyen bonyodalmakrl tbbet a 17.6.
alfejezetben.)
Ha a jtk nem zrussszeg, akkor egyttmkds kt jtkos esetn is ltrejhet. Tegyk fel pldul, hogy
ltezik olyan vgllapot, amelynek hasznossga vA = 1000, vB = 1000 , s 1000 mindkt jtkos szmra az
elrend legnagyobb hasznossg. A kt jtkos optimlis stratgija akkor az, hogy ennek az llapotnak az
elrse rdekben mindent megtesznek azaz a kt jtkos automatikusan kooperlni fog, hogy a klcsnsen
elnys clt elrjk.
3. Alfa-bta nyess
A minimax keress problmja, hogy a jtkban a megvizsgland llapotok szma exponencilis a lpsek
szmban. A kitevtl sajnos megszabadulni nem tudunk, m lnyegben megfelezhetjk. A trkk az, hogy
lehetsges a korrekt minimax dnts kiszmtsa anlkl, hogy a jtkfban minden csompontra r kelljen
nzni. Ehhez klcsnzhetjk a 4. fejezetben megismert nyess (prunning) gondolatt, s a jtkfa nagyobb
rszt a megfontolsokbl kihagyhatjuk. A konkrt vizsglt technika az alfa-bta nyess (alpha-beta
prunning). Ha ezt egy standard minimax fra alkalmazzuk, ugyanazt az eredmnyt adja vissza, mint a minimax,
a dntsre hatssal nem lv gakat azonban lenyesi.
Tekintsk ismt a 6.2. brn lthat egylpsvltsos jtkft. Kvessk mg egyszer az optimlis dnts
kiszmtsnak menett, most azonban ksrjk figyelemmel, hogy mit is tudunk valjban a folyamat minden
pontjban. A lpsekhez a 6.5. bra ad magyarzatot. Az eredmny az, hogy meg tudjuk hatrozni a minimax
dntst anlkl, hogy a kt levlcsompontot brmikor is megnznnk.
A mdszert rtelmezhetjk mskppen is, mint a MINIMAX-RTK fggvny egy egyszerstst. Legyen a C
csompontot a 6.5. brn lthat, ki nem rtkelt kvet csompontok rtke x s y, s legyen z a kett
minimuma. A gykrcsompont rtke ekkor:
148
Created by XMLmind XSL-FO Converter.
Fontos
Az alfa-bta nyesst tetszleges mlysg fkra lehet alkalmazni, s sokszor lehetsges, hogy levelek
helyett teljes rszfkat nyessnk le. Az ltalnos elv az albbi: tekintsnk egy olyan n csompontot
valahol a fa belsejben (lsd 6.6. bra), hogy a Jtkosnak lehetsge legyen e csompontba lpni. Ha a
Jtkosnak van az n szlcsompontjnl vagy ettl feljebb brmelyik dntsi pontban egy jobb
vlasztsa, m, akkor az n-t az aktulis jtkban soha nem rjk el. Ha az n-rl teht (nhny
kvetjnek megvizsglsval) mr eleget tudunk, hogy ehhez a konklzihoz jussunk, a csompontot
nyugodtan lenyeshetjk.
Emlkezznk, hogy a minimax keress mlysgi keress, egy adott idben teht elegend a fban egy egyedi t
menti csompontokkal foglalkozni. Az alfa-bta nyess megnevezse kt paramtertl szrmazik, mely
paramterek az t mentn megjelen visszalptetett rtkek korltjaira vonatkoznak:
= az t mentn tetszleges dntsi pontban a MAX szmra eddig megtallt legjobb (azaz a legmagasabb
rtk) vlaszts rtke.
= az t mentn tetszleges dntsi pontban a MIN szmra eddig megtallt legjobb (azaz a legkisebb rtk)
vlaszts rtke.
6.5. bra - Az optimlis dnts kiszmtsnak lpsei a 6.2. brn lthat jtkfa
esetn. Minden ponton a lehetsges rtkek terjedelmt mutatjuk meg minden egyes
csompont szmra. (a) A B csompont alatt az els levlnek 3 az rtke. B teht, ami
egy MIN csompont, legfeljebb 3 rtk. (b) A B alatti msodik csompontnak 12 az
rtke. MIN ezt a lpst elkerli, gy B rtke mg mindig legfeljebb 3. (c) A B alatti
harmadik levlnek 8 az rtke. B sszes kvetit lttuk mr, B rtke teht pontosan 3.
Most azt kvetkeztethetjk ki, hogy a gykr rtke legalbb 3, mert MAX-nak a
gykrben 3-as rtk vlasztsa van. (d) A C alatti els levlnek 2 az rtke. C teht,
ami egy MIN csompont, legfeljebb 2 rtk. De mi tudjuk mr, hogy B-nek 3 az rtke,
MAX teht C-t soha nem fogja vlasztani. Azrt nem is rdemes C tovbbi kvetit
megvizsglni. Ez az alfa-bta nyess egy pldja. (e) A D alatti els levlnek 14 az
rtke, gy D rtke legfeljebb 14. Ez tbb mint MAX legjobb alternatvja (azaz 3), meg
kell vizsglni ezrt D kvetit. Jegyezzk meg, hogy most a gykr minden kvetje
esetn rendelkeznk rtkkorlttal, a gykr rtke legfeljebb 14. (f) D msodik
kvetjnek rtke 5, gy tovbb kell folytatnunk a vizsglatot. A harmadik kvet
rtke 2, D rtke teht pontosan 2. MAX dntse a gykrnl, hogy B fel kell lpni, 3-as
rtkkel.
149
Created by XMLmind XSL-FO Converter.
Az alfa-bta keress az s a rtkeit munka kzben frissti, s a csompontnl a megmarad gakat lenyesi
(a rekurzv hvst terminlja), amint csak biztoss vlik, hogy az aktulis csompont rtke rosszabb lesz, mint
az aktulis s rtk, MAX-ra, illetve MIN-re. A teljes algoritmust a 6.7. bra mutatja. Btortjuk az olvast,
hogy a 6.5. brn lthat fra alkalmazva, kvesse vgig az algoritmus mkdst.
Az alfa-bta nyess hatkonysga ersen fgg a kvet csompontok vizsglatnak sorrendjtl. Pldul a 6.5.
(e) s (f) brn D egyetlen kvetjt sem lehetne lenyesni, mert elszr a legrosszabb kvett ( MIN
szemszgbl) generltuk. Ha a harmadik kvett elsnek generlnnk, a marad kettt le lehetne nyesni. Ez
azt sugallja, hogy rdemes lenne elszr a legjobbnak tn csompontokat megvizsglni.
6.6. bra - Alfa-bta nyess: ltalnos eset. Ha m a Jtkos szmra jobb, mint n, akkor
a jtk sorn sosem fogunk elrni n-be.
150
Created by XMLmind XSL-FO Converter.
Ha felttelezzk, hogy ez megtehet,4 akkor az alfa-bta nyessnek elg az O(bm/2) csompontot megvizsglni, a
legjobb lps kiszmtshoz, a minimax O(bm) rtkvel szemben. Ez azt jelenti, hogy az effektv elgazsi
tnyez b helyett
lesz pldul a sakk esetben 35 helyett 6. Ms szval, az alfa-bta nyess ugyanannyi
id alatt ktszer olyan messzire nz, mint a minimax. Ha a kvet csompontokat vletlen sorrendben
vizsglnnk a legjobbat-elszr helyett, a vizsglt csompontok ssz-szma O(b3m/4) lenne, mrskelt rtk bkre. A sakk esetben egy igen egyszer rendezfggvny (mint pldul az, hogy elszr a letsekkel, majd a
tmadsokkal, ezt kveten az elrelpsekkel s vgl a htralpsekkel prblkozunk) a legjobb esetre
vonatkoz O(bm/2) eredmnyt egy 2-es tnyez erejig kzelti meg. Dinamika hozzadsa a lpsrendez
smkhoz, mint pldul azokkal a lpsekkel prblkozni elszr, amelyek legutbb a legjobbnak bizonyultak,
az elvi korlthoz egszen kzel visz.
A 3. fejezetben megjegyeztk, hogy a keressi fban az ismtld llapotok a keressi kltsgekben
exponencilis nvekedshez is vezethetnek. Jtkokban gyakran elfordulnak ismtld llapotok a
transzpozcik (transpositions) a lpsi szekvencinak az ugyanahhoz az llshoz vezet klnbz
permutcii miatt. Ha pldul Fehr lpse a1, amire Fekete b1 lpssel vlaszolhat, s a tbla ms rszn van
egy vele nem kapcsolatos a2 lpse, amire Fekete b2-vel vlaszolhat, akkor az [a1, b1, a2, b2] s az [a1, b2, a2, b1]
Termszetesen nem tkletes mdon, klnben a sorbarendez-fggvny segtsgvel egy hibtlan jtkot tudnnk jtszani.
151
Created by XMLmind XSL-FO Converter.
szekvencik mind ugyanabban az llsban vgzdnek (ahogy ebben az llsban vgzdik az elbbi lpsek
minden a2-vel kezdd permutcija). rdemes ennek az llsnak a kirtkelst az els elfordulskor egy
hash-tblban eltrolni, mert gy a ksbbi elfordulsoknl a kiszmts megismtlst megsproljuk.
Az elbb ltott pozcik hash-tbljt hagyomnyosan transzpozcis tblnak (transposition table) hvjk. Ez
lnyegben azonos a GRF-KERESS zrt listjval 5. szakasz - Az Ismtelt llapotok elkerlse. A
transzpozcis tbla hasznlata drmai hats lehet s a sakkban nha az elrhet mlysg megduplzshoz
vezet. Msrszt ha msodpercenknt a csompontok milliit rtkeljk ki, nem praktikus ezeket mind a
transzpozcis tblban tartani. A legrtkesebb csompontok megvlasztsra klnbz stratgikat dolgoztak
ki.
6.7. bra - Az alfa-bta keressi algoritmus. Ugyanazt a szmtst hajtja vgre, mint egy
norml minimax algoritmus a 6.3. brn, kivve kt sort a MAX-RTK s a MIN-RTK
hvsokban, ahol az s a rtkeket kezeli (s adminisztrlja e paramterek tadst).
hasznossgi fggvnyt egy heurisztikus KIRTKEL kirtkel fggvny helyettesti, amely az lls
hasznossgnak egy becslst adja meg, valamint a clllapottesztet egy vgsi teszt (cutoff test) vltja fel,
amely eldnti, hogy KIRTKEL-t kell-e alkalmazni.
153
Created by XMLmind XSL-FO Converter.
ahol a w-k a slyok s az f-ek az adott tblalls jellemzi. Sakk esetben az fi-k a tbln lev egyes bbufajtk
szmt jellhetik s a wi-k a bbukhoz rendelt pontrtkek (gyalog 1, fut 3 stb.) lehetnek.
A tulajdonsgrtkek sszeadsa rtelmes dolognak tnik, azonban ezzel valjban egy igen ers felttelezssel
lnk: t. i. hogy az egyes tulajdonsgok hozzjrulsai ms tulajdonsgok rtkeitl fggetlenek. A 3-as rtk
hozzrendelse a futhoz figyelmen kvl hagyja pldul azt, hogy a vgjtkban, amikor sok tr ll
rendelkezsre a manverezshez, a fut ersebb. Ezrt a jelenlegi sakk- s ms jtkokat jtsz programok a
tulajdonsgok nemlineris kombinciit is hasznljk. Egy futpr egy kicsit rtkesebb lehet pldul, mint egy
fut rtknek ktszerese, s egy fut a vgjtkban rtkesebb, mint a nyitsnl.
6.8. bra - Kt, kiss eltr sakktblalls. (a) Feketnek egy huszr s kt gyalog elnye
van, s a jtkot megnyeri. (b) Fekete veszt, miutn Fehr a vezrt leti.
Az les elmj olvas szreveszi, hogy a tulajdonsgok s a slyok a sakk szablyainak nem rszei! Ezek az
emberi sakkjtszs vszzados tapasztalataibl szrmaznak. Lineris kirtkel kpletet alkalmazva a
tulajdonsgok s a slyok az llapotoknak az rtkeik szerinti igazi sorrendezsk legjobb kzeltst adjk
meg. A tapasztalat klnskppen azt sugallja, hogy az egy pontnl nagyobb biztonsgos anyagi elny
valsznleg gyzelemhez vezet, ha minden ms tnyez azonos. Hrompontos elny elegend a majdnem
biztos gyzelemhez. Olyan jtkokban, ahol ilyen tapasztalatra szert tenni nem lehet, a kirtkel fggvny
slyrtkeit a 18. fejezetben lert gpi tanulsi technikkkal lehet becslni. Biztat, hogy e technikk sakkra
trtn alkalmazsa tnyleg azt tmasztja al, hogy egy fut kb. hrom gyalogot r.
154
Created by XMLmind XSL-FO Converter.
Fehr kvetkez lpsben azonban leti a fekete vezrt, krptls nlkl. Az lls gy valjban Fehr szmra
jelent gyzelmet, viszont hogy ezt belssuk, egy tovbbi lpsvltsig elre kellene nzni.
Nyilvnvalan egy kifinomultabb levgsi tesztre van szksg. A kirtkel fggvnyt csak az egyenslyi
(quiescent) tblallsokra szabad alkalmazni, vagyis olyan llsokra, amelyek rtke a kzeljvben nem
vltozik meg radiklisan. A sakkban pldul az olyan tblallsok, amelyeknl tisztet lehet letni, egy csak a
pontrtket figyelembe vev kirtkel fggvny esetn nem tekinthetk egyenslyi llsnak. A nem egyenslyi
tblallsokat tovbb ki lehet fejteni, amg egyenslyi llsokat nem rnk el. Ezt a tbbletkeresst egyenslyi
keressnek (quiescence search) nevezzk. Ezt a keresst nha csak bizonyos tpus lpsekre korltozzk, mint
pldul a tblalls bizonytalansgait gyorsan felold bbuletsekre.
A horizontproblmt (horizont problem) nehezebb megszntetni. A problma akkor jelentkezik, amikor a
program az ellenfl egy olyan kvetkez lpsvel kerl szembe, ami komoly krokat okoz, s egyben
elkerlhetetlen. Tekintsk a 6.9. bra sakkjtszmjt. Fekete egy kicsit ersebb pontrtk, ha azonban Fehr a
hetedik sorrl a nyolcadikba tudja juttatni a gyalogjt, akkor vezrr vltozik, s Fehr knnyen megnyeri a
jtszmt. Fekete ezt 14 lpsvltssal elodzhatja, ha bstyval sakkot ad, de a fehr gyalog elkerlhetetlenl
vezrr fog vltozni. A rgztett mlysg keressek problmja, hogy ezek azt gondoljk, hogy ilyen elodz
lpsekkel el lehet kerlni a vezrr vltoztat lpst. Azt mondjuk, hogy az elodz lpsek a vezr vltst a
horizonton tlra kitoljk, egy olyan helyre, ahol ezt nem lehet szrevenni.
155
Created by XMLmind XSL-FO Converter.
Mivel a hardverek fejldse mlyebb keresshez vezet, azt vrjuk, hogy a horizontproblma kevsb lesz
gyakori, a nagyon hossz ksleltet lpsszekvencik igen ritkk. A szingulris kiterjeszts (singular
extension) hasznlata szintn hatsos a horizontproblma elkerlsben, lnyeges keressi kltsgtbblet
nlkl. A szingulris kiterjeszts egy olyan lps, amely lnyegesen jobb, mint az lls minden ms lpse. A
szingulris kiterjeszts keresse lnyeges tbbletkltsg nlkl a normlis mlysgkorlton tl is mehet, mert
elgazsi tnyezje egysgnyi. (Az egyenslyi keresst a szingulris kiterjeszts egy vltozatnak lehet
tekinteni.) A 6.9. brn a szingulris kiterjeszts a lehetsges vezrlpst meg fogja tallni, feltve, hogy Fekete
sakkot ad s Fehr vdekez lpseit nyilvnvalan jobb-nak azonostja a tbbi alternatvhoz kpest.
Eddig a keress egy adott szinten trtn levgsrl s az eredmnyt igazoltan nem befolysol alfa-bta
nyessrl beszltnk. De elrenyesst (forward prunning) is alkalmazhatunk, ahol egy adott csompontban
egyes lpseket minden tovbbi elemzs nlkl azonnal lenyesnk. A sakkozk tbbsge egy adott llsnl
nyilvn csak nhny lpst vesz figyelembe (legalbb tudatosan). Sajnos ez a megkzelts veszlyes lehet, mert
nincs garancia arra, hogy nem fogjuk a legjobb lpst lenyesni. Ez katasztroflis lehet, ha a gykr kzelben
trtnik, mert a program sokszor nhny nyilvnval lpst el fog nzni. Az elrenyesst specilis
helyzetekben biztonsgosan lehet alkalmazni pldul amikor a kt lps szimmetrikus, vagy ms szempontbl
ekvivalens, elegend csak az egyiket figyelembe venni , vagy olyan csompontoknl, amelyek a keressi fban
mlyen tallhatk.
156
Created by XMLmind XSL-FO Converter.
Az itt lert technikk kombinlt alkalmazsval egy elfogadhat szinten sakkoz (vagy ms jtkot jtsz)
programot kaphatunk. Tegyk fel, hogy a sakk esetre implementltunk egy kirtkel fggvnyt, egy rtelmes
keresslevgst egyenslyi keresssel s egy nagy transzpozcis tblt. Tegyk fel azt is, hogy hnapokig tart
munks bitfaragssal, a legjabb PC-n tudunk generlni s kirtkelni msodpercenknt kb. egymilli
csompontot, ami kb. 200 milli csompont megvizsglst teszi lehetv lpsenknt a standard idkorltok
mellett (3 perc lpsenknt). A sakk elgazsi tnyezje tlagosan kb. 35. Mivel 35 5 kb. 50 millival egyenl, a
minimax keresst alkalmazva gy csak t lpsvltsig tudnnk elrenzni. Br egy ilyen program nem
hasznavehetetlen, egy tlagos emberi jtkos, aki esetenknt hat vagy nyolc lpsvltsig tud elrenzni,
knnyszerrel bolondot tudna belle csinlni. Az alfa-bta nyesssel kb. 10 lpsvltst kapunk, ami a jtk
mesteri sznvonalnak felel meg. A 6.7. alfejezet tovbbi nyessi technikkat r le, amikkel az effektv keressi
mlysg durvn 14 lpsvltsig kiterjeszthet. A nagymesteri minstshez egy lnyegesen finomtott
kirtkel fggvny kellene tovbb az optimlis megnyitsok s a vgjtkok nagy adatbzisa. s az sem
rtana, ha lenne egy szuperszmtgpnk, amin a programot futtatnnk.
6.10. bra - Egy tipikus ostblalls. A jtk lnyege, hogy az egyik fl sszes bbujt
eltvoltsuk a tblrl. Fehr az ramutat jrsval egyez irnyban halad a 25-s fel,
mg Fekete az ramutat jrsval ellenttes irnyban, a 0 fel halad. Egy bbuval
brmelyik helyre lehet lpni, kivve azokat a helyeket, ahol az ellenflnek mr legalbb
kt bbuja tallhat. Ha egy olyan helyre lpnk, ahol az ellenflnek egy bbuja
tallhat, akkor azt a bbut elfogtuk, s a lpkedst az elejrl kell jrakezdenie. Ennl
a tblallsnl Fehr pp most dobott 65-t, s ngy megengedett lps kzl
vlaszthat: (510,511), (511,1924), (510,1016) s (511,1116).
157
Created by XMLmind XSL-FO Converter.
158
Created by XMLmind XSL-FO Converter.
Habr Fehr tudja, hogy szmra melyek a megengedett lpsek, azt nem tudja, hogy Fekete milyen szmokat
fog dobni, gy nem tudhatja, hogy melyek lesznek Fekete megengedett lpsei. Ez azt jelenti, hogy Fehr nem
tud egy 3 3-as ambnl ltott teljes jtkfhoz hasonlt elkszteni. Az ostbla esetn a jtkfnak a MAX s
MIN csompontok mellett tartalmaznia kell vletlen csompontokat (chance nodes) is. A 6.11. brn a vletlen
csompontokat krk jellik. A vletlen csompontokbl kiindul gak a lehetsges kockadobsokat jellik.
Minden g a dobott rtkkel s elfordulsnak valsznsgvel van felcmkzve. Kt kockval trtn
dobsnl harminchatfle eredmnyt kaphatunk. Ezek a dobsok mind azonos valsznsgek, mivel azonban a
65 megegyezik az 56-tal, gy csak 21 klnbz dobs ltezik. A hat dupla (11-tl egszen 66-ig) 1/36-od
valsznsggel, mg a tbbi 15 klnbz dobs 1/18-ad valsznsggel fordul el.
A kvetkez lps annak megrtse, hogyan kell helyes dntseket hozni. Nyilvnvalan tovbbra is azt a lpst
szeretnnk kivlasztani, ami a legjobb llshoz vezet. A lehetsges llsok azonban most nem rendelkeznek egy
jl meghatrozott minimax rtkkel. Ehelyett csak egy tlagos vagy vrhat rtket (expected value) tudunk
kiszmtani, ahol az tlagolst az sszes lehetsges kockadobsra vgezzk el. Ezzel a determinisztikus jtkok
minimax rtkt (minimax value) a vletlen csompontokat tartalmaz jtkok vrhatminimax rtkre
(expectiminimax value) ltalnostottuk. A vgllapotok s a MAX s MIN llapotok (ahol a kockadobs
eredmnye ismert) ugyangy viselkednek, mint eddig. A vletlen csompontok kirtkelshez az sszes
lehetsges kockadobs figyelembevtelvel szmtott slyozott tlagot kell venni, vagyis:
159
Created by XMLmind XSL-FO Converter.
Mg ha a fa mlysgkorltja egy kis rtk d is, a minimaxhoz kpesti tbbletkltsg miatt irrelis tl messzire
elrenzni a vletlen jtkok tbbsgnl. Ostblnl n rtke 21, b pedig ltalban 20 krli rtket vesz fel, de
bizonyos helyzetekben akr 4000 is lehet, a dupla kockadobsoknl. Valsznleg csak hrom lpsvltst
tudunk kezelni.
A problmrl msflekpp is gondolkodhatunk: az alfa-bta algoritmus elnye, hogy figyelmen kvl hagyja
azokat a ksbbi fejlemnyeket, amelyek a legjobb jtk sorn egyszeren nem kvetkeznek be. gy a valszn
elfordulsokra koncentrl. A kockt hasznl jtkok esetn nem lteznek valszn lpssorozatok, mivel
adott lpsek megttelhez elszr a kocknak kell a megfelel oldalra esnie, hogy ezek a lpsek egyltaln
megengedhetk legyenek. Ez egy ltalnos problma minden olyan esetben, amikor a bizonytalansg is kpbe
kerl: a lehetsgek risi mrtkben megsokszorozdnak, s rtelmetlenn vlik rszletes cselekvsi terveket
kidolgozni, mert a vilg valsznleg nem ezek szerint fog viselkedni.
160
Created by XMLmind XSL-FO Converter.
Ktsgtelen, hogy az olvasnak mr eszbe jutott, hogy valami alfa-bta nyesshez hasonl dolgot a vletlen
csompontokat tartalmaz jtkfkra is alkalmazni lehetne. Kiderl, hogy ez valban lehetsges. A MAX s a MIN
csompontok elemzse vltozatlan, de egy kis lelemnyessggel a vletlen csompontokat is nyeshetjk.
Tekintsk a 6.11. bra C vletlen csompontjt, s nzzk meg, mi trtnik az rtkvel, amikor a gyermekeit
vizsgljuk s kirtkeljk. Krds, hogy lehetsges-e C rtkre egy fels korltot tallni, mg mieltt az sszes
gyermekt megvizsglnnk? (Idzzk vissza, hogy az alfa-bta nyessnek pontosan erre van szksge ahhoz,
hogy egy csompontot s az abbl kiindul rszft lenyeshesse.) Ez els pillantsra lehetetlennek tnhet, mivel
a C rtke a gyermekei rtknek az tlaga, s amg nem lttuk az sszes kockadobs eredmnyt, addig ez az
tlag akrmi is lehet, mivel a meg nem vizsglt gyermekek akrmilyen rtket felvehetnek. Ha azonban a
hasznossgfggvny lehetsges rtkeit korltok kz szortjuk, akkor korltokat kaphatunk az tlagra is.
Pldul ha azt mondjuk, hogy a hasznossgrtkek +3 s 3 kztt lehetnek, akkor a levlcsompontok rtkei
mr korltosak, s a vletlen csompont rtkre az sszes gyermeknek megvizsglsa nlkl is adhatunk fels
korltot.
5.3. Krtyajtkok
A krtyajtkok sok szempontbl rdekesek, nem csupn a szerencsejtk-jellegk miatt. A jtkok risi
vlasztkbl azokra fogunk sszpontostani, ahol a krtykat a jtk elejn vletlen mdon osztjk szt, s ahol
mindegyik jtkos ltal kapott leoszts ms jtkosok szmra nem megfigyelhet. Ilyen jtk a bridzs, a
whistjtk, a hearts5 s a pker nhny formja.
Az els pillantsra gy tnhet, hogy a krtyajtkok pont olyanak, mint a kockadobsos jtkok. A krtykat
vletlenl osztjuk szt, s ez meghatrozza a jtkosok lehetsges lpseit. Itt azonban az sszes kocka a
legelejn grdl le! Ezt a hasonlatot prbljuk tovbbvinni. Ki fog derlni, hogy ez a gyakorlatban igen hasznos
lesz. Mellesleg hibs is, igen rdekes okok miatt.
Kpzeljk el, hogy kt jtkos, MAX s MIN, ngykrtys ktkezes bridzset gyakorol, ahol minden kzleoszts
lthat. A leosztsok az albbiak, s MAX hv elsnek:
MAX: 6 6 9 8 MIN: 4 2 10 5
Tegyk fel, hogy MAX 9-et jtszik. MIN-nek szint kell jtszania, teht 10-et vagy 5-t. MIN 10-et jtszik
s elviszi az tst. Most MIN kvetkezik s 2-vel indul. MAX-nak nincs pikkje (s gy az tst elvinni nem
tudja), kvetkezskppen valamelyik krtyjt le kell jtszania. Nyilvnval vlaszts a 6, mert a kt msik
gyztes krtya. Most fggetlenl attl, hogy MIN mivel indul a kvetkez tsben, MAX az utols kt tst
elviszi, s a jtk kt-kt ts szinten dntetlen lesz. Knny megmutatni a minimax megfelel vltozatval
(lsd 6.12. feladat), hogy MAX 9-es indulsa valjban egy optimlis vlaszts.
Mdostsuk most MIN leosztst, 4-et 4-re cserlve:
MAX: 6 6 9 8 MIN: 4 2 10 5
A kt eset tkletesen szimmetrikus: a jtk lefolysa azonos lesz, kivve, hogy a msodik tsnl MAX a 6-ot
fogja megjtszani. A jtk ugyangy dntetlen lesz kt-kt tssel, s a 9 optimlis dnts lesz most is.
Egyelre minden jnak tnik. Most rejtsk el MIN krtyinak egyikt: MAX tudja, hogy MIN-nek vagy az egyik (
4-gyel), vagy a msik ( 4-gyel) leosztsa van, de fogalma sincs melyik. MAX a kvetkezkppen rvel:
A 9-es induls optimlis vlaszts MIN els leosztsval szemben s hasonlan a msodik leosztsval
szemben is, gy most is optimlisnak kell lennie, mert tudomsom szerint MIN-nl a kt leoszts valamelyike van.
Amit MAX hasznl, azt ltalnossgban a jvbe lts szerinti tlagolsnak nevezhetnnk. Az tlet a cselekvs
rtkelse nem ltott krtyk mellett oly mdon, hogy elszr kiszmtunk minimax rtkeket minden
lehetsges leoszts esetre, majd vrhat rtket szmtunk a leosztsokra nzve, azok valsznsgt
felhasznlva.
Ha azt gondolja, hogy ez egy rtelmes stratgia (vagy ha nincs vlemnye, mert nem rti a bridzset), tekintse a
kvetkez trtnetet:
5
Az Angolmagyar Nagysztr sem segt ezeknek a jtkoknak nincs a mai magyar nyelvben hasznlatos nevk. (A ford.)
161
Created by XMLmind XSL-FO Converter.
1. nap: Az A t egy halom aranyhoz vezet. A B t egy elgazshoz vezet. Ha az elgazsnl balra fordul, egy
kszerhegyet tall, ha az elgazsnl jobbra fordul, elti egy busz.
2. nap: Az A t egy halom aranyhoz vezet. A B t egy elgazshoz vezet. Ha az elgazsnl jobbra fordul, egy
kszerhegyet tall, ha az elgazsnl balra fordul, elti egy busz.
3. nap: Az A t egy halom aranyhoz vezet. A B t egy elgazshoz vezet. Ha jl vlaszt, egy kszerhalmot tall,
ha rosszul, elti egy busz.
Nyilvnval, nem buta dnts, ha az els kt napon a B utat vlasztjuk. Nincs olyan pelmj szemly azonban,
aki a harmadik napon is maradna B-nl. Mgis pontosan ez az, amit a jvbe lts szerinti tlagols sugall. A B
t az 1. nap s a 2. nap helyzetekben optimlis, kvetkezskppen optimlis a 3. nap szituciban is, hiszen az
els kt eset egyike fog elfordulni. Trjnk vissza a krtyajtkunkhoz: miutn MAX 9-et hv, MIN 10-zel
gyz. MIN 2-vel indul, mint korbban, s most MAX ott van az elgazsnl brmifle eligazts nlkl. Ha MAX a
6-ot jtszotta meg, s MIN-nek van mg 4-e, 4 lesz a gyztes, s MAX a jtkot elveszti. Hasonlan, ha MAX
a 6-ot jtszotta meg, s MIN-nek van mg 4-e, MAX szintn veszteni fog. A 9 els zben val hvsa teht
olyan helyzethez vezet, ahol MAX-nak 50%-os eslye van a vesztsre (sokkal jobb lenne, ha a 6-ot vagy a 6ot hvn elsnek, dntetlent biztostva).
A leszrend lecke az, hogy amikor hinyos az informci, meg kell fontolni, hogy milyen informcival
fogunk rendelkezni a jtk minden pillanatban. MAX algoritmusval az a problma, hogy felttelezi, hogy
minden lehetsges leosztsnl a jtk gy folytatdik, mintha minden krtya lthat lenne. Ahogy a pldnk
mutatja, ez olyan cselekvsre kszteti MAX-ot, mintha minden jvbeli bizonytalansg felolddna, ha eljn az
ideje. MAX algoritmusa sem fog soha informcigyjtshez folyamodni (vagy a partner informlshoz), mert
egy-egy leosztson bell erre nincs szksge. Az olyan jtkoknl, mint a bridzs, gyakran rtelmes dolog olyan
krtyval indulni, amely segti kiderteni az ellensg leosztst, vagy a partnernket a sajt leosztsunkrl
informlja. Ilyen viselkedst automatikusan generlhatunk a nem tkletes informcij jtkokra kifejlesztett
optimlis algoritmussal. Az ilyen algoritmus nem a vilgllapotok terben (krtyaleosztsok), hanem a hiedelmi
llapotok terben (belief states) (hiedelmek, hogy kinek milyen krtyja van, milyen valsznsggel) keres.
Az algoritmust a 17. fejezetben tudjuk majd megfelelen elmagyarzni, miutn felptettk a szksges
valsznsgi appartust. Abban a fejezetben azzal a nagyon fontos szemponttal is fogunk foglalkozni, hogy a
nem tkletes informcij jtkokban az a legjobb, ha minl kevesebb informcit adunk ki az ellensgnek, s
ennek legjobb mdszere, ha nem megjsolhat mdon cseleksznk. Ez az oka annak, hogy az tteremellenrk
vletlen mdon vlasztjk meg az ellenrzsek idpontjt.
6.1. Sakk
Herbert Simon 1957-ben megjsolta, hogy 10 ven bell a szmtgpek legyzik az emberi vilgbajnokot.
Negyven v mltval hatjtszms kirakatmrkzsen a Deep Blue legyzte Garri Kaszparovot. Simon tvedett,
de csak egy 4-es szorzval. Kaszparov azt rta:
A mrkzs dnt jtszmja a 2. jtszma volt, amely emlkeimben sebknt maradt meg
lttunk valamit, ami a legvadabb elkpzelseinket is fellmlta, hogy egy szmtgp hogyan
lesz kpes dntseinek hossz tv pozcis konzekvenciit elre ltni. A gp emberi
veszlyrzetet produklva megtagadta, hogy egy dnten rvid tv elnyt jelent llsba
kerljn.
(Kaszparov, 1997)
A Deep Blue-t Murray Campbell, Feng-Hsiung Hsu s Joseph Hoane fejlesztettk ki az IBM-nl (Campbell s
trsai, 2002), a Campbell s Hsu ltal korbban a Carnegie Mellon Egyetemen kifejlesztett Deep Thought
tervre alapozva. A gyzedelmes gp egy prhuzamos szmtgp volt 30 IBM RS/6000 processzorral, amelyek
a szoftverkeresst futtattk, s 480 VLSI sakk-clprocesszorral, amelyek a lpsgenerlst (belertve a
162
Created by XMLmind XSL-FO Converter.
6.1.1. Dmajtk
Az IBM-nl dolgoz Arthur Samuel szabad idejben 1952-tl kezdve kifejlesztett egy dmaprogramot, mely a
kirtkel fggvnyt tbb ezerszer sajt maga ellen jtszva maga tanulta meg. Ezt az tletet a 21. fejezetben
trgyaljuk rszletesebben. Samuel programja egy kezd jtkos szintjn kezdett jtszani, de miutn nhny
napig nmagval jtszott, mr Samuel jtkszintjt is fellmlta (br Samuel nem szmtott ers jtkosnak).
1962-ben a program Robert Nealyt a vak dmajtk bajnokt is megverte, egy hibs lpse miatt. Sokan azt
hittk, hogy ezzel bizonytst nyert, hogy dmajtkban a gp ersebb, mint az ember, azonban ez gy nem igaz.
Ha viszont figyelembe vesszk, hogy Samuel szmtgpe (egy IBM 704-es) 10
000 szavas memrival,
httrtrknt mgnesszalagos egysggel s majdnem egy milliszekundumos ciklusidvel rendelkezett, ez a
gyzelem az MI nagy eredmnyeinek egyike marad.
Kevesen prbltk meg tlszrnyalni ezt a teljestmnyt, amg Jonathan Schaeffer s kollgi ki nem
fejlesztettk a Chinookot, amely kznsges PC-n futott s alfa bta keresst alkalmazott. A Chinook egy olyan
elre ltrehozott adatbzissal dolgozott, amely az sszes nyolc vagy kevesebb bbut tartalmaz 444 millird
llsbl plt fel, hogy a vgjtka hibtlan legyen. 1990-ben az U.S. Openen a Chinook msodikknt futott be
s megnyerte a jogot, hogy a vilgbajnoki cmrt mrkzzn. Ekkor a program Marion Tinsley kpben egy
problmba tkztt. Dr. Tinsley mr 40 ve vilgbajnok volt s ez alatt a 40 v alatt sszesen csak hrom
jtszmt vesztett. A Chinookkal vvott els mrkzsn elszenvedte a negyedik, majd az tdik veresgt is, de
a bajnoksgot 20,5:18,5 pontra megnyerte. 1994 augusztusban a Tinsley s a Chinook kztti vilgbajnoki
mrkzs id eltt flbeszakadt, amikor Tinsleynek egszsggyi problmk miatt vissza kellett vonulnia. A
Chinook lett a hivatalos vilgbajnok.
Schaeffer gy gondolja, hogy megfelel szmtsi teljestmnnyel a vgjtkok adatbzist annyira ki lehetne
bvteni, hogy a kezdeti pozcitl indul elre keress valamelyik mr megoldott pozcit mindig el tudn rni,
vagyis a dmajtk teljesen megoldhat lenne (volt, hogy a Chinook mr az 5-ik lpsnl gyztt). Az ilyen
kimert elemzst kzi mdszerekkel a 3 3-as ambra meg lehet tenni s szmtgpen a 4 4 4-es
ambra (Qubic), a Go-Mokura (t egy sorban) s a Nine-Mens Morrisra is elvgeztk (Gasser, 1998). Ken
Thompson s Lewis Stiller figyelemre mlt munkja (Thompson s Stiller, 1992) az sszes t- s hatfigurs
163
Created by XMLmind XSL-FO Converter.
6.1.2. Othello
Az Othello vagy ms nven Reversi szmtgpes jtkknt taln npszerbb, mint tblajtkknt. Keressi tere
kisebb, mint a sakk, ltalban 5-15 megengedett lps van, de a kirtkel szaktudst a semmibl indulva
kellett kifejleszteni. 1997-ben a Logistello program (Buro, 2002) az emberi vilgbajnokot, Takeshi Murakamit,
kpes volt hat nullra megverni. ltalnossgban elfogadott, hogy az Othellban az emberek nem ellenfelei a
szmtgpeknek.
6.1.3. Ostbla
A 6.5. alfejezetben elmagyarztuk, hogy a kockadobsbl ered bizonytalansg a mly keresst drga luxuss
teszi. Az ostblra vonatkoz kutatsok zme a kirtkel fggvny javtsra sszpontosult. Gerry Tesauro
(Tesauro, 1992) neurlis hls technikkkal (lsd 20. fejezet) tvzte Samuel megerstses tanulsi mdszert,
hogy egy figyelemre mlt kirtkel fggvnyt hozzon ltre, amit 2-es, illetve 3-as mlysg keresssel egytt
hasznlt. A sajt magval jtszott tbb mint egy milli tant jtszma utn Tesauro programja, a TD-GAMMON a
vilgranglistn stabilan az els hrom jtkos kztt foglal helyet. A program eredmnyei alapjn a jtk nyit
lpseit tekintve egyes esetekben az eddigi gyakorlat radiklisan megvltozott.
6.1.4. G
zsiban a g a legnpszerbb tblajtk, ami a mesterektl legalbb olyan felkszltsget ignyel, mint a sakk.
A 19 19-es tbla miatt az elgazsi tnyez 361-gyel indul, gy a hagyomnyos keressi algoritmusok teljesen
hasznlhatatlanok. Egszen 1997-ig kompetens programoknak hre-hamva sem volt, most azonban mr
programok is kpesek elfogadhat lpseket tenni. A legjobb programok tbbsge alakzatfelismersi
technikkat (amikor adott alakzat elfordul, akkor bizonyos lps megttelt kell megfontolni) korltos
keresssel (annak eldntsre, hogy bizonyos kveket el lehet-e fogni, egy loklis terleten maradva) kombinl.
A knyv rsnak idejn a legersebb programok valsznleg Chen Zhixing Goemate s Michael Reiss Go4++
programja voltak, mindegyiket kb. 10 kyu-ra (gyenge amatrszint) rtkeltk. A g olyan terletnek tnik, ami a
kifinomult kvetkeztetsi mdszereket alkalmaz intenzv kutatsokbl valsznleg nyerhet. Sikert hozhat
pldul az, hogy megtalljuk annak a mdjt, hogy sok, lazn csatolt rszjtszmra (amire a g
dekomponlhat) vonatkoz loklis kvetkeztets nhny szlt hogyan kellene integrlni. Az ilyen technikk
az intelligens rendszerek szempontjbl hihetetlen rtket kpviselnek.
6.1.5. Bridzs
A bridzs egy nem tkletes informcij jtk az egyik jtkos krtyi a tbbi jtkos ell el vannak rejtve. A
bridzs tbbszemlyes jtk is egyben, ngy jtkossal kett helyett, br a jtkosok kt csapatot alkotnak,
prban. Ahogyan ezt a 6.5. alfejezetben lttuk, egy bridzsparti optimlis lejtszsa az informcigyjts, a
kommunikci, a blffls s a valsznsgek gondos mrlegelsnek az elemeit is tartalmazhatja. E
technikkbl szmos elemet hasznl a Bridge Baron program (Smith s trsai, 1998), amely megnyerte az
1997-es Szmtgpes Bridzsbajnoksgot. Br nem jtszik optimlisan, a Bridge Baron azon ritka sikeres,
jtkot jtsz programok egyike, amelyek hierarchikus tervksztsi technikkat alkalmaznak (lsd 12. fejezet),
olyan magas szint, bridzsjtkosok szmra ismers tleteket felhasznlva, mint az impasszols (finessing) s
a dobsknyszer (squeezing).
A GIB program (Ginsberg, 1999) meggyz flnnyel nyerte meg a 2000. vi bajnoksgot. A GIB a jvbe
lts szerinti tlagols mdszert hasznlja, kt lnyegi mdostssal. Elszr, ahelyett hogy megvizsgln,
hogy egy adott vlaszts mennyire bizonyul jnak a rejtett krtyk minden lehetsges kombincija mellett
(amibl 10 milli is lehet), a program egy vletlenszeren vlasztott 100 kombincibl ll mintt vizsgl.
Msodszor, a GIB magyarzatalap ltalnostst (explanation-based generalization) hasznl arra, hogy
klnfle standard helyzetekre az optimlis jtkvezets ltalnos szablyait kiszmtsa s eltrolja. Ez lehetv
teszi minden leoszts egzakt megoldst. A GIB taktikai pontossga ellenslyozza azt, hogy az informcira
kvetkeztetni nem tud. Az 1998-as emberi vilgbajnoksgon az egyenl rang mrkzsen (egy leoszts
lejtszsban) 35-bl 12-ikknt vgzett, az emberi szakrtk elvrsait messze tlszrnyalva.
7. rtkels
164
Created by XMLmind XSL-FO Converter.
Mivel a jtkokban az optimlis dnts kiszmtsa a legtbb esetben kezelhetetlen, ezrt az sszes
algoritmusnak valamilyen felttelezssel s kzeltssel kell lnie. A minimax algoritmuson, kirtkel
fggvnyeken s az alfa-bta algoritmuson alapul standard megkzelts csak egy lehetsges megolds.
Valsznleg a standard megkzelts azrt emelkedik ki a versenyjtkokra alkalmazott tbbi mdszer kzl,
mert korn vetettk fel s intenzven fejlesztettk. A terlet nhny szakrtje gy gondolja, hogy a jtkok pp
ezrt vltak el az MI f irnyvonaltl, mert a standard megkzelts mr nem hagy elegend teret ahhoz, hogy
j betekintst nyerjnk a dntshozatal ltalnos krdseibe. Ebben a rszben az alternatv megkzeltsekre
fogunk rpillantani.
Elszr tekintsk a minimax algoritmust. A minimax optimlis mdszert ad egy lps kivlasztshoz egy adott
keressi fbl, feltve, hogy a levlcsompontok kirtkelsei tkletesen pontosak. A valsgban azonban a
kirtkelsek az lls rtknek durva becsli, s gy vehetjk, hogy nagy hibval rendelkeznek. A 6.13. bra
egy olyan egylpsvltsos jtkft mutat, amire a minimax alkalmatlannak tnik. A minimax a jobb oldali gat
javasolja, holott nagyon valszn, hogy a bal oldali g valdi rtkei nagyobbak. A minimax azon a
felttelezsen alapul, hogy a 100-as, a 101-es, a 102-es s a 100-as cmkt visel csompontok mindegyike
valban jobb, mint a 99-es cmkt visel csompont. Az a tny azonban, hogy a 99-es cmkj csompontnak
1000-es cmkj testvrei vannak, azt sugallja, hogy a csompont valdi rtke valjban magasabb. Ezen
problma kezelsnek egyik lehetsges mdja, ha a kirtkels egy, a lehetsges rtkek feletti valsznsgelosztst ad vissza. Ekkor standard statisztikai mdszerekkel ki lehet szmtani a szl rtknek valsznsgeloszlst. Sajnos a testvrcsompontok rtkei ltalban ersen korrelltak, ezrt ez kltsges szmts lehet,
mert olyan rszletes ismeretre van szksg, amit ltalban nehz beszerezni.
6.13. bra - Egy olyan egylpsvltsos jtkfa, amire a minimax alkalmatlannak tnik
vonatkozik, hanem mindenfajta kvetkeztetsre is. Minden szmtst azrt vgznk el, hogy jobb dntseket
hozhassunk. Mindegyiknek van valamilyen kltsge, s mindegyik valamilyen valsznsggel bizonyos
javulst eredmnyezhet a dnts minsgben. Az alfa-bta algoritmus a lehet legegyszerbb
metakvetkeztetst foglalja magban: olyan ttelt, miszerint a fa bizonyos gait vesztesg nlkl figyelmen
kvl lehet hagyni. Ennl sokkal jobbat is lehet tenni. A 16. fejezetben megnzzk, hogy ezeket a gondolatokat
hogyan lehet pontoss s megvalsthatv tenni.
Vgezetl ismt vizsgljuk meg magnak a keressnek a termszett. A heurisztikus keress s a jtkok
algoritmusai gy mkdnek, hogy a kiindul llapotbl indul konkrt llapotsorozatokat generlnak, majd
alkalmaznak egy kirtkel fggvnyt.
Az emberek nem gy jtszanak. A sakkban gyakran van egy konkrt clunk pldul le akarjuk tni az ellenfl
vezrt , s ezt a clt hasznlhatjuk arra, hogy a cl elrse rdekben szelektven megfelel terveket
generljunk. Ez a fajta clvezrelt kvetkeztets (goal-directed reasoning) vagy tervkszts (planning) nha
teljesen eltnteti a kombinatorikus keresst (lsd IV. rsz). David Wilkins PARADISE programja (Wilkins, 1980)
az egyetlen olyan program, amely sikeresen alkalmazta a clvezrelt kvetkeztetst a sakkra: nhny 18
lpsbl ll kombincit ignyl sakkfeladvnyt is kpes volt megoldani. Ez idig azonban mg nem ltjuk
tisztn, hogyan kellene a kt algoritmustpust egyetlen robusztus s hatkony rendszerbe tvzni, br a Bridge
BaronTM jelenthet egy, a helyes irnyban tett lpst. Egy ilyen teljesen integrlt rendszer jelents eredmnynek
szmtana nemcsak a jtkkutats terletn, hanem ltalnossgban vve az MI-kutats terletn is, mert egy
ltalnos intelligens gens szmra megfelel alapot is tudna nyjtani.
8. sszefoglals
A jtkok sokasgt nztk meg, hogy megrtsk, mit is jelent optimlisan s a gyakorlatban is jl jtszani. A
legfontosabb gondolatokat az albbiakban foglalhatjuk ssze:
Egy jtkot a kiindul llapottal (initial state) (a tblallssal), mindegyik llapotban a leglis
cselekvsekkel (actions), egy vgteszttel (terminal test) (ami megmondja, hogy mikor rt vget a jtk) s
egy hasznossgi fggvnnyel (utility function) (ami megmondja, hogy ki s mennyivel nyert) lehet
megadni.
Tkletes informcival (perfect information) rendelkez ktszemlyes zrussszeg jtkoknl a
minimax algoritmus a teljes jtkfa mlysgi felsorolsval meg tudja hatrozni a jtkos legjobb lpst.
Az alfa-bta algoritmus ugyanazt a szmtst vgzi el, mint a minimax algoritmus, azonban jval
hatkonyabb, mivel lenyesi a keressi fa azon gait, amirl be tudja bizonytani, hogy a vgs eredmny
szempontjbl irrelevnsak.
A teljes jtkfa ltalban nem kezelhet (mg az alfa-bta algoritmussal sem), ezrt a keresst valahol abba
kell hagynunk, s egy kirtkel fggvnyt (evaluation function) kell alkalmaznunk, ami az adott llapot
hasznossgnak becsljt adja.
A vletlen elemet is tartalmaz jtkokat a minimax algoritmus olyan kiterjesztsvel lehet kezelni, amely a
vletlen csompontokat (chance node) gy rtkeli ki, hogy az egyes hasznossgokat a
gyermekcsompontok valsznsgvel slyozva veszi az sszes gyermekcsompontjnak az tlagos
hasznossgt.
A nem tkletes informcij jtkok (imperfect information), mint pldul a bridzs, optimlis lejtszsa
mindegyik jtkostl az aktulis s a jvbeli hiedelmi llapotaira (belief states) vonatkoz kvetkeztetst
ignyli. Egy egyszer kzelts kaphat, ha tlagoljuk egy cselekvs rtkt a hinyos informci minden
lehetsges konfigurcijra.
A programok egyenl ellenfelek, vagy akr meg is verik a legjobb emberi jtkosokat dmajtkban,
Othellban s ostblajtkban, s igen kzel llnak ehhez a bridzsben. Egy program legyzte egy
kirakatmrkzsen az emberi sakkvilgbajnokot. A gban a programok mg amatr szinten jtszanak.
megverte, mieltt kiderlt, hogy a szekrnye valjban egy trpe nvs emberi sakkmestert rejtett (Levitt,
2000). A Trk 1769-tl 1854-ig jtszott. gy tnik, Charles Babbage (aki a Trk hatsa alatt llt) volt az els,
aki 1846-ban szmtgpes sakk s dmajtk megvalsthatsgnak els komoly elemzst adta (Morrison s
Morrison, 1961). Tervezett egy 3 3-as ambt jtsz clgpet is, amit soha sem ptett meg. Az els igazi
jtkgpet 1890 tjn egy spanyol mrnk, Leonardo Torres y Quevedo tervezte s ptette meg. A KRK a
sakkvgjtkra specializlt gp volt (kirly s bstya a kirly ellen) s kpes volt brmilyen kiindul llsbl
mattot adni.
A minimax algoritmust sokszor Ernst Zermelo, a modern halmazelmlet atyja 1912-es cikkhez vezetik vissza.
A cikk sajnlatos mdon tartalmaz hibkat, s a minimaxot nem rja le helyesen. A jtkelmlet komoly alapjait
a nagy hats Theory of Games and Economic Behavior c. munkban Neumann s Morgenstern (Neumann s
Morgenstern, 1944) fektettk le, kimutatva azt is, hogy egyes jtkokban szksg van randomizlt (avagy nem
megjsolhat) stratgikra. (Tovbbi informcirt lsd 17. fejezet.)
A korai szmtgpes korszak szmos prominens szemlyt kvncsiv tette a szmtgpes sakk lehetsge.
Konrad Zuse aki elsknt tervezett programozhat szmtgpet igen rszletes tleteket dolgozott ki arra,
hogy ezt hogyan lehetne megvalstani (Zuse, 1945). Norbert Wiener nagy befolys Cybernetics c. knyve
(Wiener, 1948) tartalmazta egy szmtgpes sakkprogram mkdsnek egy lehetsges vzlatt, a minimax
keresst, a mlysgi levgst s a kirtkel fggvnyt is belertve. Claude Shannon a modern szmtgpes
jtkok elvi alapjait sokkal rszletesebben fejtette ki, mint Wiener (Shannon, 1950). Shannon bevezette az
egyenslyi lls fogalmt, s nhny tletet vzolt fel a szelektv (nem kimert) jtkfakeressre vonatkozlag.
Slater s az ugyanabban a ktetben a cikkre reflektl szerzk szintn megvizsgltk a szmtgpes sakkozs
lehetsgeit (Slater, 1950). I. J. Good Shannontl fggetlenl kidolgozta az egyenslyi lls fogalmt (Good,
1950).
1951-ben Alan Turing rta meg az els valdi szmtgpes programot, ami kpes volt egy teljes sakkjtszmt
lejtszani (Turing s trsai, 1953). Valjban azonban Turing programja sohasem futott szmtgpen, kzi
szimulcival teszteltk egy nagyon gyenge emberi sakkjtkos ellen, aki legyzte a programot. Idkzben D.
G. Prinz megrt s valban futtatott is egy programot (Prinz, 1952), ami sakkfeladvnyokat oldott meg, br nem
jtszott teljes jtszmt. Alex Bernstein rta az els olyan sakkprogramot, amely egy teljes standard sakkjtszmt
jtszott (Bernstein s Roberts, 1958; Bernstein s trsai, 1958).6
Az alfa-bta keress alaptlett John McCarthy dolgozta ki 1956-ban, habr nem publiklta. Az NSSsakkprogram az alfa-bta algoritmus egy leegyszerstett vltozatt hasznlta, ez volt az els sakkprogram, ami
ezt alkalmazta (Newell s trsai, 1958). Nilsson szerint Arthur Samuel dmaprogramja (Samuel, 1959; 1967)
szintn alfa-bta algoritmust hasznlt, habr maga Samuel ezt nem emlti a rendszerrl publiklt beszmoliban
(Nilsson, 1971). Az 1960-as vek elejn jelentek meg az alfa-bta algoritmust ismertet cikkek (Hart s
Edwards, 1961; Brudno, 1963; Slagle, 1963b). Az alfa-bta algoritmus egy teljes implementcijt Slagle rta le
egy cikkben (Slagle s Dixon, 1969), ami a kalah7 jtkot jtsz jtkprogram mkdst ismertette. A John
McCarthy egyik dikja ltal rt KotokMcCarthy sakkprogram (Kotok, 1962) is az alfa-bta algoritmust
hasznlta. Knuth ismerteti az alfa-bta algoritmus trtnett (Knuth s Moore, 1975), megadja az algoritmus
teljessgnek a bizonytst s elvgzi az idigny elemzst. Knuth s Moore elemzse az alfa-bta keressnek
a kvetk vletlen sorba rendezsvel O((b/logb)d) aszimptotikus komplexitst mutatott ki, ami lehangol
eredmny, mert a b/logb effektv elgazsi tnyez magnl a b-nl nem sokkal jobb. Ksbb jttek r, hogy az
aszimptotikus kplet csak a b > 1000 igaz, s az aktulis jtkokra tallhat elgazsi tnyezkre a gyakran
idzett O(b3d/4) rvnyes. Pearl megmutatta (Pearl, 1982b), hogy az alfa-bta algoritmus aszimptotikusan
optimlis az sszes rgztett mlysg jtkfa-keressi algoritmus kztt.
Az els kt sakkprogram, ami egyms ellen jtszott, a KotokMcCarthy-program s a Moszkvai Elmleti s
Ksrleti Fizika Intzet ltal megrt ITEP program (Adelson-Velsky s trsai, 1970) volt az 1960-as vek
kzepn. Ezt az interkontinentlis mrkzst tvrn jtszottk le. A kzdelem 1967-ben az ITEP-program 3:1
arny gyzelmvel rt vget. A MacHack 6 volt az els olyan sakkprogram, ami sikeresen jtszott emberek
ellen (Greenblatt s trsai, 1967). 1400-as l-pontszma jval tbb volt, mint a kezdk 1000-es l-pontja,
azonban gy is igen messze volt a 2800 vagy tbb l-ponttl, ami szksges lett volna, hogy Herb Simon 1957es jslata teljesljn, miszerint 10 ven bell a szmtgpes sakkprogramok lesznek a sakkvilgbajnokok
(Simon s Newell, 1958).
Newell (Newell s trsai, 1958) egy orosz BESM programot emlt, amely lehet, hogy Bernstein programjt megelzte.
A kalah egy afrikai eredet ktszemlyes jtk, amelyben kavicsokat (gymntokat) kell trakosgatni csszk kztt. Tbb szmtgpes
vltozata is ltezik, l. pldul: http://ceman.ecn.purdue.edu/~ee373/kalah.html. (A ford.)
6
7
167
Created by XMLmind XSL-FO Converter.
helyettestst javasolja, s azt mutatja ki, hogy ez bizonyos jtkokban jobb dntsekhez vezet. A keress
klnfle szinteken val levgsbl s a kirtkel fggvny alkalmazsbl add hatsok elmlete mg
mindig szegnyes.
A vrhatminimax algoritmust Donald Michie vetette fel (Michie, 1966), habr az kzvetlenl kvetkezik
Neumann s Morgenstern jtkfa-kirtkelsi elmletbl. Bruce Ballard az alfa-bta nyesst kiterjesztette a
vletlen csompontokat is tartalmaz fkra (Bruce Ballard, 1983). Az els sikeres ostblaprogram a BKG volt
(Berliner, 1977; 1980b). Csak 1 mlysgig keresett s bonyolult, manulisan sszelltott kirtkel fggvnyt
hasznlt. Ez volt az els szmtgpes program, ami kpes volt legyzni egy emberi vilgbajnokot az ismert
klasszikus tblajtkok egyikben (Berliner, 1980a), habr Berliner elsknt ismerte el, hogy ez csak egy rvid,
bemutat mrkzs volt (nem egy vilgbajnoki mrkzs), s hogy a BKG nagyon szerencss kzzel dobott a
kockval. Gerry Tesauro kutatsai, elszr a NEUROGAMMON (Tesauro, 1989), majd a TD-GAMMON (Tesauro, 1995)
programokkal, azt mutattk, hogy sokkal jobb eredmny rhet el a megerstses tanulssal (amely terlettel a
21. fejezetben foglalkozunk).
A dma, s nem a sakk volt az els olyan klasszikus jtk, amire egy valban szmtgpen fut program kpes
volt vgigjtszani egy teljes jtszmt. Christopher Strachey rta az els mkdkpes dmajtkprogramot
(Strachey, 1952). Schaeffer (Schaeffer, 1997) nagyon olvasmnyosan lerja a Chinook a vilgbajnok
dmajtkprogram fejlesztstrtnett az sszes mhelytitkval egytt.
Az els gprogramokat valamivel a dma- s a sakkprogramok utn fejlesztettk ki (Lefkovitz, 1960, Remus,
1962), s lassabban fejldtek a dma- s a sakkprogramoknl. Ryder tiszta keressalap megkzeltst hasznlt
(Ryder, 1971) a szelektv nyessi mdszerek egsz palettjval, hogy le tudja gyzni a hatalmas elgazsi
tnyezbl add problmt. Zobrist felttel-cselekvs szablyokat hasznlt elfogadhat lpsek generlsra,
ha a jtkban ismert alakzatok jelentek meg (Zobrist, 1970). Reitman s Wilcox j eredmnnyel kombinlta a
szablyokat s a keresst (Reitman s Wilcox, 1979), a legtbb modern program kvette ezt a hibrid
megkzeltst. A szmtgpes g jelenlegi llst Mller (Mller, 2002) foglalja ssze, s tmrdek
hivatkozst is kzl. Anshelevich (Anshelevich, 2000) hasonl mdszereket a HEX jtkra alkalmaz. A friss
fejlemnyekrl a Szmtgpes Go Szvetsg ltal kiadott Computer Go Newsletter szmol be.
A szmtgpes jtkokrl tbb frumon jelennek meg cikkek. A felettbb flrevezet nev
konferenciakiadvny, a Heuristic Programming in Artificial Intelligence szmol be a Szmtgpes
Sakkolimpikrl, amely rendezvnyek a jtkok egsz sorra terjednek ki. A jtkprogramok kutatsrl fontos
cikkeket publikltak szmos szerkesztett cikkgyjtemnyben (Levy, 1988a; Levy, 1988a; Marsland s
Schaeffer, 1990). Az 1977-ben alaptott Nemzetkzi Szmtgpes Sakkszvetsg (International Computer
Chess Association, ICCA) negyedvenknt adja ki az ICGA Journalt (korbban ICCA Journal). (Clarke, 1977)
ta fontos cikkek jelentek meg az Advances in Computer Chess antolgiasorozatban. Az Artificial Intelligence
folyirat 134. ktete (Artificial Intelligence, 2002) lersokat tartalmaz a legfejlettebb sakk, Othello, Hex, shogi,
g, ostbla, pker, Scrabble s ms jtkprogramokrl.
8.2. Feladatok
6.1.
Ez a feladat a jtkok alapvet elveit a 3 3-as ambn (krk s ikszek) keresztl gyakoroltatja be. Xn azon
sorok, oszlopok vagy tlk szmt jelli, ahol pontosan n db X, mg egyetlen O sem tallhat. Hasonlan, On
azon sorok, oszlopok vagy tlk szmt jelli, ahol pontosan n db O, mg egyetlen X sem tallhat. A
hasznossgfggvny +1-et rendel minden olyan llshoz, ahol X3 = 1, s 1-et rendel minden olyan llshoz,
ahol O3 = 1. Az sszes tbbi vglls hasznossga 0. A nem vgllapotok esetn az albbi mdon definilt
lineris kirtkel fggvnyt fogjuk hasznlni:
Kirtkel(s) = 3X2(s) + X1(s) (3O2(s) + O1(s))
169
Created by XMLmind XSL-FO Converter.
d. A fban az 1-es s a 0-s mlysgben lev llsokhoz a minimax algoritmust felhasznlva tntesse fel a felfel
terjesztett rtkeket, s hasznlja fel azokat a legjobb kezd lps meghatrozshoz.
e. Karikzza be a 2-es szinten lev azon csompontokat, amelyeket az alfa-bta nyess alkalmazsa esetn az
algoritmus nem rtkelne ki, felttelezve, hogy a csompontokat az algoritmus az alfa-bta nyesshez
optimlis sorrendben generlja.
6.2.
Bizonytsa be az albbi lltst: minden jtkfa esetn a MAX ltal kapott hasznossg, amikor MAX a minimax
dntst hasznlva jtszik egy szuboptimlis MIN-nel szemben, sohasem lesz alacsonyabb, mint az a hasznossg,
ami akkor r el, ha egy optimlis MIN-nel szemben jtszana. Ki tud tallni egy olyan jtkft, ahol MAX egy
szuboptimlis stratgival egy szuboptimlis MIN-nel szemben mg jobban teljestene?
6.3.
Tekintse a 6.14. brn ltott ktszemlyes jtkot.
a. Rajzolja fel a teljes jtkft az albbi konvencit alkalmazva:
minden llapotot (SA, SB) formban rja fel, ahol SA s SB a zsetonok helyzete.
minden vgllapotot egy ngyzetbe, a jtkrtkt pedig egy krbe rja be.
a hurokllapotokat (azon llapotok, amelyek mr megjelentek a gykrig vezet t mentn) dupla
ngyzetekbe rja be. Mivel nem vilgos, hogy az ilyen llapotok rtke mennyi, jellje be mindegyiket egy
krbe rt ?-lel.
b. Most mindegyik csomponthoz rja be a visszaterjesztett minimax rtkt (szintn egy krbe rva).
Magyarzza meg, hogy a ? rtkeket hogyan kezelte, s mirt?
c. Magyarzza meg, hogy a standard minimax ebben a jtkfban mirt fulladna kudarcba, s rviden vzolja
fel, hogy a (b) krdsre adott vlaszra tmaszkodva hogyan lenne kpes az algoritmust megjavtani. Kpese a mdostott algoritmus megadni az optimlis dntseket az sszes hurkokat tartalmaz jtkban?
d. Ez a 4-ngyzetes jtk n ngyzet esetre ltalnosthat, minden n > 2-re. Bizonytsa be, hogy A gyz, ha n
pros, s veszt, ha n pratlan.
6.14. bra - Egy egyszer jtk kiindul llsa. Az A jtkos indul elsnek. Mindkt
jtkos felvltva lp s a zsetonjt a szomszdos szabad helyre helyezheti, mindkt
irnyban. Ha a szomszdos mez foglalt, akkor a jtkos az ellenfl felett tugorhat a
kvetkez szabad helyre, ha van ilyen. (Pldul ha A a 3-n s B a 2-n van, akkor A
visszalphet 1-re.) A jtknak vge, ha az egyik jtkos elri a tbla ellenttes vgt. Ha
az A jtkos elsnek ri el a 4-et, a jtk rtke +1, ha B jtkos ri el elsnek az 1-et, a
jtk rtke az A szmra 1.
170
Created by XMLmind XSL-FO Converter.
6.4.
Implementljon lpsgenertort s kirtkel fggvnyt az albbi jtkok kzl nhnyat: kalah, Othello, dma,
sakk. Az implementcit hasznlva tervezzen egy ltalnos alfa-bta jtkgenst. Hasonltsa ssze a keressi
mlysg nvelsnek, a lpssorrendezs tkletestsnek s a kirtkel fggvny tkletestsnek a hatst.
Milyen kzel esik az n effektv elgazsi tnyezje a tkletes lpssorrendezs idelis esethez?
6.5.
lltsa el az alfa-bta nyess helyessgnek formlis bizonytst. Ehhez tekintse a 6.15. brn bemutatott
helyzetet. A krds az, hogy az algoritmus lenyesse-e az nj csompontot, ami egy max-csompont s az n1
leszrmazottja. Az alaptlet, hogy akkor s csak akkor nyessk le, ha n1 minimax rtke igazolhatan fggetlen
nj rtktl.
a. n1 rtkt az albbi kplet adja meg:
n1 = min(n2, n21, , n2b2)
171
Created by XMLmind XSL-FO Converter.
6.8.
Tekintse az albbi eljrst a lpsek megvlasztsra a vletlen csompontot is tartalmaz jtkokban:
Generljon egy megfelel szm (mondjuk 50) kockadobsbl ll sorozatot egy megfelel (mondjuk 8)
mlysgig.
Ismert kockadobsok esetn a jtkfa determinisztikuss vlik. Minden egyes kockadobs-sorozatra oldja
meg az eredmnyl kapott determinisztikus jtkft az alfa-bta algoritmussal.
Az eredmnyeket hasznlja fel az egyes lpsek rtknek megbecslsre, s vlassza ki a legjobb lpst.
Helyesen fog mkdni ez az eljrs? Mirt (nem)?
6.9.
rjon s implementljon egy vals idej, tbbszemlyes jtszkrnyezetet, ahol az id a krnyezeti llapot rsze,
s a jtkosok rgztett idszeleteket kapnak.
6.10.
Adja meg s/vagy implementlja az albbi jtkok egyikre vagy akr tbbre is az llapotlerst, lpsgenerlst
s a kirtkel fggvnyt: Monopoly, Jtk a betkkel, bridzs (egy konkrt licitet felttelezve) s pker
(vlassza meg a kedvenc vltozatt).
6.11.
Gondosan tekintse t a 6.10. feladat minden egyes jtkban a vletlen esemnyek s a rszleges informcik
sszefggseit.
a. Melyikre lesz j a standard vrhatminimax modell? Implementlja az algoritmust s futtassa le a
jtkgensben a jtkkrnyezet szksges mdostsaival.
b. Melyekre lenne j a 6.8. feladatban lert sma?
c. Vitassa meg, hogyan kellene kezelni azt a tnyt, hogy egyes jtkokban a jtkosok nem rendelkeznek
ugyanazzal az informcival az aktulis llapotrl.
6.12.
A minimax algoritmus felttelezi, hogy a jtkosak felvltva lpnek, az olyan krtyajtkokban azonban, mint a
whist vagy a bridzs, mindig a lets gyztese indul a kvetkeznek.
a. Mdostsa algoritmust, hogy e jtkokra is megfelelen mkdjn. Felttelezheti, hogy rendelkezsre ll a
GYZTES (lets) fggvny, amely azt adja vissza, hogy az adott letst mely krtya nyerte meg.
b. Rajzolja fel a 5.2. szakasz - A vrhatminimax komplexitsa rszben lthat els leosztsra a jtkft.
6.13.
A Chinook dmaprogram kiterjedten hasznlja a vgjtk adatbzisokat, amelyek pontos rtket adnak a jtk
utols hat lpsben elll sszes llshoz. Hogyan lehet egy ilyen adatbzist hatkonyan legenerlni?
6.14.
Vitassa meg, hogyan alkalmazhat a jtkok standard megkzeltse az olyan jtkokra, mint pldul a tenisz, a
pl s a krikett, amelyeket folytonos, fizikai llapottrben jtszanak.
6.15.
rja le, hogy a minimax s az alfa-bta hogyan vltozik ktszemlyes, nem zrussszeg jtkok esetn, ahol
minden jtkosnak kln kirtkel fggvnye van. Felttelezheti, hogy mindegyik jtkos msok kirtkel
173
Created by XMLmind XSL-FO Converter.
fggvnyeit ismeri. Ha a kt vghasznossg rtkre nincs korlt, lehetsges-e valamelyik csompont szmra,
hogy az alfa-bta lenyesi?
6.16.
Tegyk fel, hogy egy olyan sakkprogrammal rendelkezik, amely kpes egymilli csompontot kirtkelni
msodpercenknt. Vlassza a jtklls egy tmr reprezentcijt a transzpozcis tbla szmra. Kb. mennyi
llst kpes eltrolni memriban, az 500 Mbjt nagysg tblban? Elg lesz-e ez a lpsenknt alloklt 3
perces keresshez? Hny tblakiolvasst kpes megvalstani egy llskirtkels ideje alatt? Most ttelezze fel,
hogy a transzpozcis tbla nagyobb, s nem fr el a memriban. Hny kirtkelst lehetne megvalstani egy
diszkhozzfrs ideje alatt, standard diszkhardver mellett?
174
Created by XMLmind XSL-FO Converter.
Logikai gensek
ptsnk a wumpus vilg szmra. Azonostjuk majd az tletkalkulus bizonyos hinyossgait, amelyek mg
hatkonyabb logikk fejlesztst fogjk motivlni a kvetkez fejezetekben.
1. A tudsbzis gens
Egy tudsbzis gens kzponti eleme a tudsbzisa (knowledge base). Egyszeren fogalmazva, a tudsbzis
mondatok (sentences) halmaza. (Itt a mondatot technikai fogalomknt hasznljuk. A fogalom kapcsolatban
van az angol, a magyar vagy ms termszetes nyelvek mondataival, de nem azonos velk.) A mondatokat egy
nyelv segtsgvel fejezzk ki, amelyet tudsreprezentcis nyelvnek (knowledge representation language)
neveznk, s a vilgrl szl lltsokat fogalmazunk meg vele.
j mondatoknak a tudsbzishoz val hozzadsra, illetve a tuds lekrdezsre valamilyen eljrsra van
szksgnk. Ezeknek a feladatoknak a tipikus elnevezse a KIJELENT, illetve a KRDEZ. Mindkt feladat
tartalmazhat kvetkeztetst (inference), azaz j mondatok levezetst rgiekbl. A logikai genseknl (logical
agents), amelyekkel ebben a fejezetben foglalkozunk, a kvetkeztetssel szemben az alapvet kvetelmny,
hogy amikor valaki KRDEZ egy krdst a tudsbzisrl, akkor a vlasznak kvetkeznie kell azokbl a
mondatokbl, amit korbban a tudsbzishoz hozzadtunk (pontosabban KIJELENT-ettnk). Ksbb a fejezetben
mg pontosabban lerjuk az igen fontos kvetkezik fogalom jelentst. Most egyelre ez jelentsen csak annyit,
hogy a kvetkeztetsi folyamat sorn nem csak gy egyszeren keletkeznek dolgok.
A 7.1. bra egy tudsbzis gens programjnak vzt mutatja. Mint ahogy az sszes gensnk, ez is szlel
valamit bemenetknt, s egy cselekvst ad vissza vlaszknt. Az gens fenntart egy tudsbzist, TB-t, amely
kezdetben bizonyos httrtudst (background knowledge) tartalmazhat. Ha az gensprogramot meghvjk, az
hrom dolgot tesz. Elszr KIJELENT-i a tudsbzisnak, hogy mit szlelt. Msodszor KRDEZ-i a tudsbzist,
hogy milyen cselekvst kell vgrehajtania. A lekrdezs megvlaszolsnak folyamatban egyre bvl
kvetkeztetst lehet vgezni a vilg pillanatnyi llapotrl, a lehetsges cselekvssorozatok eredmnyrl s gy
tovbb. Harmadszor az gens rgzti a kivlasztott cselekvst a KIJELENT felhasznlsval, s vgrehajtja a
cselekvst. A msodik KIJELENT azrt szksges, hogy a tudsbzissal tudassuk, hogy a felttelezett cselekvs
vgrehajtsa megtrtnt.
A reprezentcis nyelv rszletei hrom fggvnyben vannak elrejtve, amelyek az rzkelk s beavatkozk, az
alapreprezentci, valamint a kvetkeztet rendszer kztti kapcsolatot valstjk meg. Az SZLELS-MONDATKSZTS eljrs egy olyan mondatot konstrul, amelyik megllaptja, hogy az gens egy adott pillanatban
szlelte az rzkelt dolgot. A CSELEKVS-KRDEZS-KSZTS az idt felhasznlva bemeneti adatknt,
visszatr egy mondattal, amely alkalmas arra, hogy megkrdezzk, milyen cselekvs szksges ebben a
pillanatban. Vgl a CSELEKVS-MONDAT-KSZTS egy olyan mondatot hoz ltre, amely megllaptja, hogy a
kivlasztott cselekvs vgrehajtsa megtrtnt. A kvetkeztetsi mechanizmus rszletei a KIJELENT s a
KRDEZ eljrsok belsejben vannak elrejtve. A ksbbi fejezetekben ezeket a rszleteket is bemutatjuk.
A 7.1. bra gense egszen hasonlnak tnik, mint a 2. fejezetben bemutatott bels llapottal rendelkez gens.
Azonban a KIJELENT s a KRDEZ eljrsok defincija miatt a tudsbzis gens nem egy tetszleges,
cselekvseket meghatroz program. Meghatrozhat egy lerssal a tudsszinten (knowledge level), ahol csak
azt kell megfogalmaznunk, hogy mit tudjon s milyen cljai legyenek az gensnek, hogy rgzthessk a
viselkedst. Pldul egy automata taxi szmra a cl lehet egy utas elszlltsa Marin megybe, s a taxi
ismerheti, hogy ez San Franciscnl van, s a Golden Gate hd az egyetlen, amelyen keresztl oda el lehet jutni.
Ezutn felttelezhetjk, hogy tmegy a Golden Gate hdon, mivel tudja, hogy el fogja rni a cljt. Vegyk
176
Created by XMLmind XSL-FO Converter.
Logikai gensek
szre, hogy ez az elemzs fggetlen attl, hogy a taxi hogyan is mkdik az implementcis szinten
(implementation level). Nem szmt, hogy a fldrajzi elhelyezkedssel kapcsolatos tudsa lncolt listkkal
vagy pixeltrkpekkel van megvalstva, vagy hogy vajon a kvetkeztetst regiszterekben trolt szimblumok
listinak manipullsval vagy neuronhlkban zajos jelek tovbbkldsvel vgzi el.
Fontos
Emltettk a fejezet bevezetjben, hogy egy tudsbzis gens megalkothat gy, hogy KIJELENT-jk
szmra, hogy mit szksges tudnia. Az gens inicializl programja a tervez krnyezetrl lv
tudst ler mondatok egyenknti tadsval pthet fel, mg mieltt az gens elkezden rzkelni a
krnyezett. Rendkvl leegyszersti az gens ltrehozsnak problmjt, ha olyan reprezentcis
nyelvet terveznk, amellyel egyszer lesz ennek a tudsnak mondatokban val megfogalmazsa. A
rendszerptsnek ezt a megkzeltsi mdjt deklaratv (declarative) mdszernek nevezzk. Ezzel
szemben a procedurlis (procedural) megkzelts kzvetlenl a program kdjban rgzti a kvnt
viselkedst, amivel minimalizlja az explicit reprezentci s a kvetkeztets szerept, s gy
lnyegesen hatkonyabb rendszer jhet ltre. Mind a ktfle gensre ltunk majd pldt a 7.7.
alfejezetben. Az 1970-es s 1980-as vekben a kt megkzelts tmogati parzs vitkat folytattak. Mi
mra felismertk, hogy egy sikeres gens tervezsekor kombinlni kell a deklaratv s a procedurlis
elemeket.
Amellett hogy KIJELENT-hetjk az gensnek, hogy mit kell tudnia, adhatunk is szmra egy olyan
mechanizmust, amely kpess teszi t, hogy sajt maga megtanulja ezt. Ez a mechanizmus, amit a 18. fejezetben
trgyalunk, ltalnos, a krnyezetre vonatkoz tudst hoz ltre rzetek sorozatnak felhasznlsval. Ezt a
tudst bele lehet illeszteni az gens tudsbzisba, s felhasznlhat a dntsek meghozatalakor. Ily mdon az
gens teljesen autonmm vlhat.
Ezek a kpessgek a reprezentci, a kvetkeztets s a tanuls mind a logika elmletnek s
technolgijnak tbb vszzados fejldsn alapulnak. Mieltt azonban az elmletet s a technolgit
elmagyarznnk, ltrehozunk egy egyszer vilgot, amelyet majd felhasznlunk ezek illusztrlshoz.
2. A wumpus vilg
A wumpus vilg (wumpus world) egy barlang, amely szobkbl s az ezeket sszekt tjrkbl ll. A
wumpus egy szrnyeteg, aki mindenkit megesz, ha a szobjba lp, a barlangban lapul valahol. Az gens le
tudja lni a wumpust, de csak egyetlen nyila van ehhez. Nhny szoba feneketlen csapdt tartalmaz, amely
mindenkit csapdba ejt, aki belp a szobba (kivve a wumpust, aki tl nagy ahhoz, hogy beleessen). A wumpus
krnyezetben az egyetlen csbt lehetsg, hogy egy halom aranyat lehet tallni. Habr a wumpus vilg
meglehetsen unalmas a modern szmtgpes jtkokhoz kpest, azonban a jtk kivl tesztkrnyezet az
intelligens gensek szmra. Michael Genesereth volt az els, aki javasolta ennek a krnyezetnek az
alkalmazst.
Egy plda wumpus vilg lthat a 7.2. brn. A pldakrnyezet pontos defincijt, ahogy a 2. fejezetben
javasoltuk, a TKCS-lerssal adjuk meg:
Teljestmnymrtk: +1000 az arany felvtele, 1000 a csapdba ess vagy ha a wumpus felfal, 1 minden
vgrehajtott cselekvs, 10 a nyl hasznlata.
7.2. bra - Egy tipikus wumpus vilg. Az gens a bal als sarokban van.
177
Created by XMLmind XSL-FO Converter.
Logikai gensek
Krnyezet: Egy szobkbl ll 4 4-es hl. Az gens mindig az [1, 1]-gyel jellt ngyzetbl indul, arccal
jobbra nzve. Az arany s a wumpus elhelyezkedse vletlenszeren, a kiindul ngyzeten kvli ngyzetek
kzl egyenletes eloszls szerint van megvlasztva. Ezen kvl mg brmely, a kiindul ngyzeten kvli
ngyzet 0,2 valsznsggel lehet csapda.
Cselekvsek: Az gens mozoghat elre, fordulhat balra 90-kal, vagy fordulhat jobbra 90-kal. Az gens
szrnysges hallt hal, ha belp egy ngyzetbe, ahol csapda van vagy egy l wumpus tallhat.
(Biztonsgos, habr meglehetsen rossz illat egy olyan ngyzetbe belpni, amelyben egy halott wumpus
van.) Az elrelpsnek nincs hatsa, ha egy fal van az gens eltt. A Megragad cselekvst lehet arra
hasznlni, hogy az gens felvegyen egy trgyat, amely vele azonos szobban van. A Lvs cselekvst lehet
hasznlni egy nylnak abban az irnyban trtn kilvsre, amerre az gens ppen ll. A nyl addig repl,
amg el nem tallja (s egyben meg nem li) a wumpust, vagy falnak nem tkzik. Az gensnek csak egy
nyila van, gy csak egy Lvs cselekvsnek van hatsa.
rzkelk: Az gensnek t rzkelje van, mindegyik egyetlen bitnyi informcit ad:
178
Created by XMLmind XSL-FO Converter.
Logikai gensek
Ha a wumpust megltk, akkor egy elkeseredett sikolyt hallat, amit a barlangban brhol hallani lehet.
Az rzeteket az gens egy t szimblumot tartalmaz lista formjban kapja meg; pldul ha bz s szell van
egy ngyzetben, de nincs ts, csillogs vagy sikoly, akkor az gens egy [Bz, Szell, Nincs, Nincs, Nincs]
rzetet kap.
A 7.1. feladatban definilni kell egy wumpus krnyezetet a 2. fejezetben megadott klnbz dimenzik
mentn. Az alapvet nehzsg az gens szmra, hogy kezdetben semmit sem tud a krnyezet konfigurcijrl.
gy tnik, hogy logikai kvetkeztetsre van szksge az gensnek ahhoz, hogy fellkerekedhessen a
tudatlansg okozta htrnyon. A wumpus vilgok legtbb pldnyban az gens szmra lehetsges az arany
biztonsgos megszerzse. Nhny krnyezetben azonban az gensnek vlasztania kell, hogy hazamegy-e res
kzzel, vagy kockzatot vllal, ami vagy az aranyhoz vagy a hallhoz vezet. s a krnyezetek 21%-a teljesen
tisztessgtelen (mivel az arany egy csapdban van vagy csapdkkal krlvett mezben).
Nzznk meg egy tudsbzis wumpus genst, hogy hogyan fedezi fel a 7.2. brn lthat krnyezetet. Az
gens kezdeti tudsbzisa a krnyezetet ler, az elzkben felsorolt szablyokat tartalmazza. Nevezetesen
tudja, hogy az [1, 1 ]-ben tartzkodik s hogy az [1, 1] biztonsgos hely. Ltni fogjuk, hogy hogyan bvl az
gens tudsa, amint j rzkelsek rkeznek s cselekvsek trtnnek.
Az els rzkels a [Nincs, Nincs, Nincs, Nincs, Nincs], amibl az gens arra tud kvetkeztetni, hogy a
szomszdos ngyzetek biztonsgosak. A 7.3. (a) bra mutatja az gens tudsnak llapott ezen a ponton. Az
brn a tudsbzis nhny mondatt soroljuk fel, betket hasznlva a megfelel ngyzetekben, mint az Sz
(szell) s az OK (biztonsgos, nincs se csapda, se wumpus). A 7.2. bra ezzel szemben magt a vilgot rja le.
Abbl a tnybl, hogy nem volt se bz, se szell az [1, 1]-ben, az gens kikvetkeztetheti, hogy az [1, 2] s [2,
1] ngyzetek veszlytelenek. Ennek jelzsre a megfelel ngyzetekbe OK-t runk. Egy vatos gens csak olyan
ngyzetbe lp, amelyrl tudja, hogy OK. Felttelezzk, hogy az gens gy dnt, hogy a [2, 1]-be megy,
ellltva a 7.3. (b) brn lthat helyzetet.
Az gens detektlja a szellt a [2, 1]-ben, teht egy csapdnak kell lennie valamelyik szomszdos ngyzetben. A
csapda nem lehet az [1, 1]-ben a jtk szablyai szerint, gy csapdnak kell lennie a [2, 2]-ben vagy a [3, 1]-ben
vagy mindkettben. A Cs? jells egy lehetsges csapdt jelez a mezkben a 7.3. (b) brn. Ezen a ponton csak
egy olyan ismert ngyzet van, ami OK, s amit mg nem ltogatott meg. gy a megfontolt gens visszafordul,
visszamegy az [1, 1]-be s az [1, 2]-be halad tovbb.
7.3. bra - Az gens els lpse a wumpus vilgban. (a) A kezdeti helyzet a [Nincs,
Nincs, Nincs, Nincs, Nincs] rzkelse utn. (b) Az els lps utn, rzkelve a [Nincs,
Szell, Nincs, Nincs, Nincs]-et.
Az j rzet az [1, 2, ]-ben a [Bz, Nincs, Nincs, Nincs, Nincs], ami a 7.4. (a) brn lthat helyzetet
eredmnyezi. A bz az [1, 2]-ben azt jelenti, hogy a wumpusnak a kzelben kell lennie. De a wumpus a jtk
szablyai szerint nem lehet az [1, 1]-ben s nem lehet a [2, 2]-ben sem (mert akkor az gens rezte volna a bzt,
amikor a [2, 1]-ben jrt). gy az gens kikvetkeztetheti, hogy a wumpus az [1, 3]-ban van. A W! jells ezt
179
Created by XMLmind XSL-FO Converter.
Logikai gensek
mutatja. Mg rdekesebb, hogy a Szell rzet hinya az [1, 2]-ben azt jelenti, hogy nincs csapda a [2, 2]-ben. De
mi mr kikvetkeztettk, hogy vagy a [2, 2]-ben, vagy a [3,1]-ben van egy csapda, ami teht azt jelenti, hogy a
csapdnak a [3, 1]-ben kell lennie. Ez egy viszonylag nehz kvetkeztets, mivel klnbz idpontokban s
klnbz helyeken gyjttt tudst hasznl fel, s egy rzet hinyra tmaszkodva vgez el egy fontos lpst.
Ez a kvetkeztets meghaladja a legtbb llat kpessgeit, de tipikusan jellemzi azt a fajta kvetkeztetst, amit
egy logikai gens vgez.
Az gens gy bebizonytotta maga szmra, hogy nincs se csapda, se wumpus a [2, 2]-ben, gy a mozgs ebbe a
ngyzetbe OK. Nem mutatjuk be az gens tudst a [2, 2]-ben, csak felttelezzk, hogy fordul s tlp a [2, 3]ba, ami a 7.4. (b) brn lthat. A [2, 3]-ban az gens detektlja a csillogst, gy megragadja az aranyat, s ezzel
vget r a jtk.
7.4. bra - Kt ksbbi helyzet az gens elrehaladsa sorn. (a) A harmadik lpst
kveten, miutn [Bz, Nincs, Nincs, Nincs, Nincs]-et rzkelt. (b) Az tdik lps s a
[Bz, Szell, Csillogs, Nincs, Nincs] rzkelse utn
Fontos
Brmely esetben, amikor az gens kvetkeztetseket von le a rendelkezsre ll informcikbl, a
kvetkezmny garantltan helyes lesz, ha a rendelkezsre ll informcik helyesek. Ez alapvet
jellegzetessge a logikai kvetkeztetseknek. A fejezet htralev rszben megmutatjuk, hogyan
pthetnk olyan logikai genseket, amelyek kpesek reprezentlni a szksges informcikat, s
kvetkeztetseket vonnak le, ahogy azt az eddigi fejezetekben lertuk.
3. A logika
Ez az alfejezet ttekintst nyjt a logikai reprezentci s kvetkeztets alapvet fogalmairl. A logika brmely
specilis formjra vonatkoz technikai rszletek bemutatst a kvetkez fejezetre halasztjuk. Ehelyett
egyszer pldkat fogunk hasznlni a wumpus vilgbl vagy ismers aritmetikai terletekrl. Azrt vlasztjuk
ezt az igen rendhagy megkzeltst, mivel a logika fogalmai messze ltalnosabbak s szebbek, mint azt
ltalban felttelezik.
A 7.1. fejezetben emltettk, hogy a tudsbzis mondatokbl ll. Ezeket a mondatokat a reprezentcis nyelv
szintaxisa (syntax) szerint fejezzk ki, amely specifiklja az sszes jl formlt, nyelvtanilag helyes mondatot. A
szintaxis fogalma elg tiszta a szoksos aritmetikai mveleteknl: x + y = 4 egy jl formlt mondat, mg az
x2y + = nem az. A logikai nyelvek szintaxisait (s a matematikt is egybknt) rendszerint cikkek s
knyvek rsa cljbl terveztk. A sz szoros rtelmben tucatjai lteznek a klnbz szintaxisoknak, nhny
tele grg betkkel s egzotikus matematikai szimblumokkal, nhny inkbb vizulisan kvethet, nyilakat s
buborkokat tartalmaz diagramokbl ll. Minden esetben azonban, az gens tudsbzisban a mondatok az
gensnek magnak vagy az gens egy rsznek valdi fizikai konfigurcii. A kvetkeztets ezeknek a
konfigurciknak a ltrehozst vagy manipullst fogja jelenteni.
180
Created by XMLmind XSL-FO Converter.
Logikai gensek
aminek jelentse, hogy az mondat maga utn vonzza a mondatot. A vonzat formlis defincija a kvetkez:
akkor s csakis akkor, ha minden modellben, amelyben igaz, szintn igaz. Kzvetlenebbl azt
mondhatjuk, hogy igazsgt tartalmazza igazsga. A vonzat relci ismers az aritmetikbl is, rmmel
vehetjk szre, hogy az x + y = 4 mondat maga utn vonzza a 4 = x + y mondatot. Nyilvnval, hogy brmely
modellben, ahol x + y = 4, mint pldul az a modell, amelyben x s y is 2 rtk, a 4 = x + y is fenn ll.
Hamarosan ltni fogjuk, hogy a tudsbzist tekinthetjk egy kijelentsnek, s gyakran beszlhetnk arrl, hogy
egy tudsbzis maga utn vonz egy mondatot.
Alkalmazhatunk hasonl elemzst az elz rszben bemutatott wumpus vilgbeli kvetkeztetsi pldra is.
Tekintsk a 7.3. (b) brn lthat szitucit: az gens nem szlelt semmit az [1, 1]-ben s szellt szlelt a [2, 1]ben. Ezek az rzetek, kombinlva az gensnek a wumpus vilg szablyaira vonatkoz tudsval (1. szakasz - A
tudsbzis gens rszben tallhat TKCS-lers), alkotja a TB-t. Az genst (ms dolgok mellett) az rdekli,
hogy vajon a szomszdos [1, 2], [2, 2], [3, 1] ngyzetek tartalmaznak-e csapdt. Brmelyik a hrom ngyzet
kzl tartalmazhat vagy ppen nem tartalmaz csapdt, gy a plda esetben 2 3 = 8 lehetsges modell ltezik. Ezt
mutatja a 7.5. bra.3
A TB hamis azokban a modellekben, amelyek ellentmondanak annak, amit az gens tud. Pldul a TB hamis
minden modellben, ahol az [1, 2] tartalmaz csapdt, mivel nincs szell az [1, 1]-ben. Valjban csak hrom
olyan modell van, amelyben a TB igaz, ezeket a 7.5. bra a modellek egy rszhalmazaknt mutatja. Most
tekintsnk kt lehetsges kvetkezmnyt:
1 = Nincs csapda az [1, 2]-ben
2 = Nincs csapda a [2, 2]-ben
181
Created by XMLmind XSL-FO Converter.
Logikai gensek
gy TB 2 s az gens nem tudja kikvetkeztetni, hogy nincs csapda a [2, 2]-ben. (s azt sem tudja
kikvetkeztetni, hogy van csapda a [2, 2]-ben.)4
Az elz plda nem csak illusztrlja a maga utn vonzst, hanem megmutatja, hogy a vonzat defincijt fel
lehet hasznlni a kvetkezmnyek levezetsre, azaz, hogy logikai kvetkeztetst (logical inference)
vgezznk. A 7.5. brn illusztrlt kvetkeztetsi algoritmust modellellenrzsnek (model checking) hvjuk,
mivel szmba vesz minden lehetsges modellt annak megvizsglsra, hogy igaz-e minden modellben,
amelyben a TB igaz.
7.5. bra - Lehetsges modelljei a csapda jelenltnek az [1, 2], [2, 2] s [3, 1]-ben, ha
adott a megfigyels, hogy az [1, 1]-ben semmi s a [2, 1]-ben szell rezhet. (a) A
tudsbzis s 1(nincs csapda[1, 2]-ben) modelljei. (b) A tudsbzis s 2(nincs
csapda[2, 2]-ben) modelljei.
Fontos
Az gens ki tudja szmolni, hogy mekkora a valsznsge annak, hogy van csapda a [2, 2]-ben. A 13. fejezet fogja megmutatni azt, hogy
hogyan.
5
A modellellenrzs mkdik, ha a modellek tere vges, mint pldul egy rgztett mret wumpus vilg esetben. Az aritmetika esetben
ezzel szemben a modellek tere vgtelen, mg akkor is, ha korltozzuk magunkat az egsz szmokra, mivel vgtelen szm x, y rtkpr
ltezik az x + y = 4 egyenlethez.
6
Hasonltsuk ssze a 3. fejezet vgtelen keressi tereinek esetvel, ahol lthat, hogy a mlysgi keress nem teljes.
4
182
Created by XMLmind XSL-FO Converter.
Logikai gensek
Egy olyan kvetkeztetsi folyamatot rtunk le, amelynek kvetkezmnyei brmely vilgban garantltan
igazak, ahol a premisszk is igazak. Nevezetesen, ha a TB igaz a valdi vilgban, akkor brmely, a
TB-bl helyes kvetkeztetsi eljrssal levezetett mondat szintn igaz a valdi vilgban. gy, mg a
kvetkeztetsi folyamat a szintaxison mkdik bels fizikai konfigurcikon, mint pldul
regiszterek bitjein vagy az agy elektromos jelzseinek mintin , addig a folyamat megfelel valdi
vilg viszonyainak. Ennek megfelelen a valdi vilg nhny aspektusa lesz az eset, 7 mivel a valdi
vilg bizonyos ms aspektusai jelenleg kpezik az esetet. Ezt a megfeleltetst a vilg s a reprezentci
kztt mutatja a 7.6. bra.
Fontos
Az utols krds, amivel foglalkoznunk kell a logikai gensek trgyalsnl, a megalapozottsg
(grounding) krdse, ami nem ms, mint a kapcsolat, ha egyltaln ltezik ilyen, a logikai
kvetkeztetsi folyamat s a valdi krnyezet kztt, amelyben az gens ltezik. Nevezetesen hogyan
tudhatjuk meg, hogy a TB igaz-e a valdi vilgban? (Ezutn a TB mr csak szintaxis az gens
fejben.) Ez egy filozfiai krds, amelyrl sok-sok knyvet rtak (lsd 26. fejezet). Egy egyszer
vlasz az, hogy az gens rzkeli ltestik a kapcsolatot. Pldul a mi wumpus vilgbeli gensnknek
van egy szagl rzkelje. Az gensprogram ltrehoz egy megfelel mondatot mindig, ha van illat. gy
brmikor, ha ez a mondat a tudsbzisban van, ez igaz a valdi vilgban is. Ezltal az rzetmondatok
jelentst s igazsgt az ket ltrehoz rzkel s mondatkonstrul folyamatok hatrozzk meg. s
mi a teend az gens tudsnak egyb rszeivel, mint az a meggyzdse, hogy a wumpus rossz illatot
terjeszt a szomszdos ngyzetekben? Ez nem egy kzvetlen reprezentcija egy egyedi rzetnek,
hanem egy ltalnos szably, pldul rzkelsi tapasztalatokbl levezetve, de nem azonos magval a
tapasztalatnak a kijelentsvel. Az ilyen ltalnos szablyokat a tanulsnak (learning) nevezett
mondatkonstrul folyamat hozza ltre, ami a VI. rsznek a trgya. A tanuls nem tvedhetetlen. Lehet,
hogy az eset az, hogy a wumpusok mindig rossz illatot rasztanak, kivve szkvekben februr 29-n,
amikor egybknt megfrdnek. gy lehet, hogy a TB nem igaz a valdi vilgban, de j tanul
eljrsokkal van ok az optimizmusra.
7.4. Az tletkalkulus: egy nagyon egyszer logika
Most egy nagyon egyszer logikt, az tletkalkulust (propositional logic) mutatjuk be.8 ttekintjk az
tletkalkulus szintaxist, majd a szemantikjt annak a mdjt, ahogy a mondatok igazsgt meghatrozzuk.
Azutn megnzzk a maga utn vonzst a relcit egy adott mondat s azon mondat kztt, amelyik az
elbbibl kvetkezik , s megnzzk, hogy hogyan vezet ez egy egyszer logikai kvetkeztets algoritmushoz.
Mindez termszetesen a wumpus vilgban fog lejtszdni.
3.1. Szintaxis
7
8
Mint azt Wittgenstein (1922) rta hres mvben, a Tractatusban: A vilg mindaz, aminek az esete fennll.
Az tletkalkulust Boole-logiknak (Boolean logic) is nevezzk, a logikval foglalkoz George Boole (18151864) utn.
183
Created by XMLmind XSL-FO Converter.
Logikai gensek
Vegyk szre, hogy a nyelvtan nagyon szigor a zrjelezsnl: minden mondatot, amelyet binris
sszektjellel hozunk ltre, zrjelek kz kell tenni. Ez biztostja, hogy a szintaxis teljesen egyrtelm. Ez azt
is jelenti pldul, hogy ((A B) C)-t kell rjunk A B C helyett. Az olvashatsg javtsa cljbl gyakran
elhagyjuk a zrjeleket, megbzva ehelyett az sszektjeleknek egy precedencia-sorrendjben. Ez hasonl az
aritmetikban alkalmazott precedencihoz pldul az ab + c-t ((ab) + c)-nek olvassuk, s nem a(b + c)-nek,
mert a szorzsnak magasabb a precedencija, mint az sszeadsnak. Az tletkalkulus precedencia-sorrendje (a
legmagasabbtl a legalacsonyabb fel: , , , s . gy a mondat:
P Q R S
184
Created by XMLmind XSL-FO Converter.
Logikai gensek
A precedencia nem oldja fel a tbbrtelmsget az olyan mondatoknl, mint az A B C, amelyet olvashatunk
((A B) C)-knt vagy (A (B C))-nek. Mivel a mondatnak ez a kt olvassa ugyanazt jelenti a kvetkez
rszben definiland szemantika szerint, az olyan mondatok, mint az A B C megengedettek. Szintn
megengedjk az A B C s az A B C mondatokat. Olyan mondatok, mint az A B C nem
megengedettek, mert a kt olvassnak klnbz jelentsei vannak, ebben az esetben ragaszkodunk a
zrjelhez. Vgl, nha hasznlni fogunk szgletes zrjelet az egyszer zrjel helyett, ami a mondatot
ttekinthetbb teszi majd.
3.2. Szemantika
Most, hogy specifikltuk az tletkalkulus szintaxist, definiljuk a szemantikjt is. A szemantika definilja a
szablyokat, amivel meghatrozhat a mondat igazsga egy bizonyos modellben. Az tletkalkulusban a modell
egyszeren az igazsgrtket igaz vagy hamis rgzti minden tletszimblumra. Pldul ha a tudsbzis
mondatai a C1,2, C2,2 s C3,1 tletszimblumokat hasznljk fel, akkor egy lehetsges modell:
m1 ={C1,2 = hamis, C2,2 = hamis, C3,1 = igaz}
Hrom tletszimblum esetn 23 = 8 lehetsges modell van pontosan azok, amelyek a 7.5. brn vannak
feltntetve. Vegyk szre azonban, hogy miutn elkteleztk magunkat egy szintaxis mellett, a modellek tisztn
matematikai objektumokk vltak, amelyeknek nem felttlenl van kapcsolatuk a wumpus vilggal. A C1,2 csak
egy szimblum, jelentheti azt, hogy csapda van az [1, 2]-ben vagy azt, hogy Prizsban vagyok ma s
holnap.
Az tletkalkulus szemantikjnak meg kell hatroznia, hogyan szmtsuk ki brmely mondat igazsgrtkt egy
adott modellben. Ez rekurzvan trtnik. Minden mondat atomi mondatokbl s az tfle sszektjelbl lett
ltrehozva, gy meg kell hatroznunk, hogy hogyan szmtsuk ki az atomi mondatok igazsgt, s meg kell
hatroznunk azt is, hogy hogyan szmtsuk ki az igazsgt az egyes sszektjelek felhasznlsval formlt
sszetett mondatnak. Az atomi mondatok esete egyszer:
Igaz minden modellben igaz, s Hamis ha minden modellben hamis.
Minden ms tletszimblumnak az igazsgrtkt kzvetlenl a modellben kell meghatrozni. Pldul a
korbban megadott m1 modellben a C1,2 hamis.
sszetett mondatokra olyan szablyaink vannak, mint
Brmely s mondatra s brmely m modellre, a s mondat az m-ben akkor s csakis akkor igaz, ha s hamis mben.
Az ilyen szablyok visszavezetik az sszetett mondatok igazsgnak eldntst egyszerbb mondatokra.
Minden sszektjelre vonatkoz szably sszefoglalhat egy igazsgtblban (truth table), amely
meghatrozza egy sszetett mondat igazsgrtkt a mondat komponenseinek minden lehetsges igazsgrtk
hozzrendelseihez. Az t logikai sszektjel igazsgtbljt mutatja a 7.8. bra. Ilyen tblk felhasznlsval
brmely s mondat igazsgrtke egy m modellre vonatkozan kiszmolhat rekurzv kirtkelsek egyszer
folyamatval. Pldul a C1,2 (C2,2 C3,1) mondatot kirtkelve m1-ben igaz (hamis igaz) = igaz igaz =
igaz rtket kapunk. A 7.3. feladat azt kri, hogy rjon egy IK-IGAZ? (s,m) algoritmust, amely kiszmtja az s
tletkalkulus mondatnak az igazsgrtkt egy m modellben.
Korbban azt mondtuk, hogy a tudsbzist mondatok halmaza alkotja. Most lthatjuk, hogy egy logikai
tudsbzis ilyen mondatok konjunkcija. Teht ha egy res TB-vel kezdnk, s vgrehajtjuk a KIJELENT(TB,
S1), ..., KIJELENT (TB, Sn) mveleteket, akkor a TB = S1 Sn ll el. Ez azt jelenti, hogy tudsbzisokat s
mondatokat egymssal felcserlheten hasznlhatunk.
Az s, vagy s nem igazsgtbli eltrnek attl, amit a termszetes nyelvi jelentsk alapjn gondolnnk.
A lehetsges flrerts legszembetnbb pontja, hogy a P Q kifejezs igaz akkor is, ha mind P, mind Q is
igaz. Ltezik msik sszektjel is, a kizr vagy-nak nevezett jel (rviden xor), amely hamisat ad, ha
mindkt diszjunkt igaz.9 Nincs ltalnos egyetrts az exkluzv vagy szimblumt illeten; kt jells is
ismert:
185
Created by XMLmind XSL-FO Converter.
Logikai gensek
Az implikci () igazsgtblja rejtlyesnek tnhet els ltsra, mivel nem teljesen illeszkedik sztns
megrtsnkhz, hogy P impliklja Q-t vagy ha P, akkor Q. Az tletkalkulus nem kvn semmilyen okokozati relcit vagy relevancit P s Q kztt. A mondat: az a tny, hogy 5 pratlan impliklja, hogy Toki
Japn fvrosa az tletkalkulusnak egy igaz mondata (a normlis interpretci szerint), mg akkor is, ha ez
hatrozottan furcsa mondatnak tnik. Egy msik esete a flrertseknek, hogy brmely implikci igaz, ha az
elzmnye hamis. Pldul az az az llts, hogy 5 pros szm, impliklja, hogy Samu okos mondat igaz,
fggetlenl attl, hogy Samu okos-e. Ez bizarrnak tnik, de elfogadhat, ha a P Q-t gy rtelmezzk, hogy
ha P igaz, akkor azt lltom, hogy Q is igaz. Egybknt nem lltok semmit. Az egyetlen eset, amikor ez a
mondat hamis, ha P igaz, de Q hamis.
A P Q ekvivalencia igazsgtblja azt mutatja, hogy akkor igaz, ha mind P Q s Q P igaz. Ezt gyakran
gy rjuk le, hogy P akkor s csakis akkor, ha Q vagy matematikban szoktk jellni P aa Q-nak. A
wumpus vilg szablyait legjobban az hasznlatval tudjuk felrni. Pldul, egy ngyzet szells, ha a
szomszdos, ha a szomszdos ngyzetben csapda van, s egy ngyzet csakis akkor szells ngyzetben csapda
van. gy ekvivalencikra van szksgnk, mint a
S1,1 (C1,2 C2,1)
ahol S1,1 jelenti, hogy szell van az [1, 1]-ben. Vegyk szre, hogy az egyirny implikci
S1,1 (C1,2 C2,1)
igaz a wumpus vilgban, de nem teljes. Nem szablyozza azokat a modelleket, amelyekben S1,1 hamis s C1,2
igaz, amivel megszegnnk a wumpus vilg szablyait. Egy msik md ennek rzkeltetsre, hogy az
implikci ignyli a csapda jelenltt, ha szell van, mikzben az ekvivalencia szintn megkvnja a csapda
hinyt, ha nincs szell.
186
Created by XMLmind XSL-FO Converter.
Logikai gensek
Egy ngyzet akkor s csakis akkor szells, ha csapda van a szomszdos ngyzetben. Ezt minden ngyzetre
vonatkozan ki kell jelenteni, mi most csak a relevns ngyzeteket tekintjk:
Sz2: S1,1 (C1,2 C2,1)
Sz3: S2,1 (C1,1 C2,2 C3,1)
Az eddigi mondatok minden wumpus vilgban igazak. Most hozzadjuk a szell rzetet az els kt
megltogatott ngyzetre abban a specifikus vilgban, ahol az gens jelenleg tartzkodik, ami elvezet a 7.3. (b)
brn ltott szitucihoz.
A tudsbzis most Sz1-tl Sz5-ig tartalmaz mondatokat. Tekinthetjk ezt gy is, mint egyetlen mondatot az Sz1
Sz2 Sz3 Sz4 Sz5 konjunkcit , mivel ez azt is kijelenti egyben, hogy minden egyes mondat is igaz.
3.4. Kvetkeztets
Emlkezznk, hogy a logikai kvetkeztets clja, hogy eldntsk, hogy TB bizonyos mondatokra.
Pldul, hogy a tudsbzis maga utn vonzza-e a C2,2 lltst. Az els algoritmusunk a kvetkeztetsre a vonzat
defincijnak kzvetlen megvalstsa lesz: vegyk sorba a modelleket, s ellenrizzk, hogy igaz-e minden
modellben, amelyben a TB igaz. Az tletlogikban a modellek az igaz s hamis rtkek hozzrendelsei minden
egyes tletszimblumhoz. Visszatrve a mi wumpus vilgbeli pldnkhoz, a relevns tletszimblumok az S1,1,
S1,2, C1,1, C1,2, C2,1, C2,2, C3,1. A 7 szimblum 27 = 128 lehetsges modellt jelent, hromban ezek kzl a TB igaz
(7.9. bra). Ebben a hrom modellben
igaz, gy nincsen csapda az [1, 2]-ben. Viszont a C2,2 a hrom
modellbl kettben igaz s egyben hamis, gy mg nem tudjuk megmondani, hogy van-e csapda [2, 2]-ben.
A 7.9. bra preczebb formban megismtli a 7.5. brn illusztrlt kvetkeztetst. A 7.10. bra egy ltalnos
algoritmust mutat a maga utn vonzs eldntsre az tletkalkulusban. Mint a VISSZALPSES-KERESS
algoritmus a 4.3. szakasz - Mlysgi keress rszben, az IT-VONZAT? egy rekurzv felsorolst vgez a vltoz
hozzrendelsek vges tern. Az algoritmus helyes, mivel kzvetlenl a vonzat defincijt valstja meg, s
teljes, mivel brmely TB-on s mondaton mkdik, s mindig sikeresen vget r, hiszen vges szm modellt
kell megvizsglni.
7.9. bra - A tudsbzis alapjn ptett igazsgtbla lthat az brn. A TB igaz, ha Sz1tl s Sz5-ig igaz, amely a 128 sorbl csak 3-ban fordul el. Mind a 3 sorban C1,2 hamis,
teht nincsen csapda az [1, 2]-ben. Viszont lehet, hogy van csapda [2, 2]-ben (br lehet,
hogy nincs).
Logikai gensek
Fontos
Termszetesen a vges szmossg nem mindig jelenti a nhnyat. Ha a TB s az mondat
sszesen n szimblumot tartalmaz, akkor 2n modell ltezik. gy az algoritmus idignye O(2n). (A
trignye csak O(n), mivel a felsorols mlysgi jelleg.) A fejezet ksbbi rszben fogunk ltni olyan
algoritmusokat, amelyek sokkal hatkonyabbak a gyakorlatban. Sajnos minden ismert, az tletlogikra
vonatkoz kvetkeztetsi algoritmusnak a legrosszabb esetre vonatkoz komplexitsa exponencilisan
fgg a bemenetek szmtl. Nem remlhetjk, hogy ennl hatkonyabbak is lehetnnk, mivel az
tletlogikban a maga utn vonzs co-NP-teljes (lsd A) fggelk).
188
Created by XMLmind XSL-FO Converter.
Logikai gensek
Fontos
Mire jk akkor az rvnyes mondatok? A vonzatokra vonatkoz defincink alapjn levezethetjk a
dedukcielmletet (deduction theorem), amelyet mr az kori grgk is ismertek:
Brmely s mondatra akkor s csakis akkor, ha az ( ) mondat
rvnyes.
(A 7.4. feladatban ennek a bizonytst krjk.) A 7.10. brn lthat kvetkeztetsi algoritmust gy
tekinthetjk, mint a (TB ) rvnyessgnek ellenrzst. Msik oldalrl nzve viszont minden
rvnyes implikci ler egy legitim kvetkeztetst.
Az utols fogalom, amelyre szksgnk lesz a kielgthetsg (satisfiability). Egy mondat kielgthet, ha igaz
nhny modellben. Pldul a korbban bemutatott tudsbzis, az (Sz1 Sz2 Sz3 Sz4 Sz5), kielgthet, mert
van hrom olyan modell, amelyben igaz, ahogy ezt a 7.9. brn megmutattuk. Ha egy mondat igaz az m
modellben, akkor azt mondjuk, hogy m kielgti (satisfies) -t, vagy m egy modellje -nak. A kielgthetsg
ellenrizhet gy, hogy a lehetsges modelleket felsoroljuk mindaddig, amg nem tallunk egyet, amely
kielgti a mondatot. A mondatok kielgthetsgnek meghatrozsa az tletlogikban az els olyan problma
volt, amelyrl bebizonytottk, hogy NP-teljes.
Szmos problma a szmtstechnikban valjban kielgthetsgi problma. Pldul a knyszerkielgtsi
problmk az 5. fejezetben alapveten arra krdeznek r, hogy a knyszerek kielgthetk-e nhny
hozzrendelssel. Megfelel transzformcik utn a keressi problmk szintn megoldhatk a kielgthetsg
ellenrzsvel. Az rvnyessg s a kielgthetsg termszetesen kapcsolatban vannak: rvnyes akkor s
csakis akkor, ha
nem kielgthet; s fordtva, akkor s csakis akkor kielgthet, ha
nem rvnyes.
A kvetkez hasznos eredmnyt is ismerjk:
akkor s csakis akkor, ha az ( ) nem kielgthet
Fontos
A mondat bizonytsa alapjn, az ( ) kielgthetetlensgnek ellenrzsvel, pontosan
megfelel a szoksos matematikai bizonytsi techniknak a redukcio ad absurdumnak (sz szerint
redukci egy abszurd dologra). Szoktk ezt megcfols (refutation) ltali bizonytsnak is nevezni
vagy bizonyts ellentmonds (contradiction) ltal. Felttelezzk, hogy a mondat hamis, s
megmutatjuk, hogy ez a felttelezs ellentmondsra vezet az ismert aximkkal. Ez az ellentmonds
pontosan azt jelenti, mint amikor azt mondjuk, hogy az ( ) mondat kielgthetetlen.
189
Created by XMLmind XSL-FO Converter.
Logikai gensek
A jells azt jelenti, hogy ha brmikor adott egy formj mondat s adott egy , akkor a mondat ebbl
kvetkezik. Pldul a (WumpusElrefel Wumpusl) Lvs s a (WumpusElrefel Wumpusl) adott,
akkor a Lvs kikvetkeztethet.
Egy msik hasznos kvetkeztetsi szably az s-kikszbls (And-Elimination), ami azt mondja ki, hogy
egy konjunkcibl brmely konjunkt kikvetkeztethet:
Nem minden kvetkeztetsi szably mkdik mindkt irnyban, mint ezek. Pldul nem futtathatjuk a Modus
Ponenst ellenkez irnyban, hogy megkapjuk -t s -t a -bl.
Nzzk meg, hogyan hasznlhatjuk ezeket a kvetkeztetsi szablyokat s ekvivalencikat a wumpus vilgban.
Az Sz1, ..., Sz5 szablyokbl ll tudsbzisbl indulunk ki, s megmutatjuk, hogy hogyan bizonythatjuk a C1,2t azaz, hogy nincs csapda az [1, 2]-ben. Elszr alkalmazzuk az ekvivalencia kikszblst Sz2-re, s gy kapjuk,
hogy
Sz6: (S1,1 (C1,2 C2,1)) ((C1,2 C2,1) S1,1)
Most alkalmazhatjuk a Modus Ponenst az Sz8-ra s az Sz4 rzetre (pldul a S1,1) s gy kapjuk:
Sz9: (C1,2 C2,1)
Teht sem az [1, 2], sem a [2, 1] ngyzet nem tartalmaz csapdt.
Az elz levezetst kvetkeztetsi szablyok egy sorozatt bizonytsnak (proof) nevezzk. A bizonyts
megtallsa pontosan olyan, mint megoldst tallni egy keressi problmra. Valjban ha a kvetkeztetsi
szablyok sszes lehetsges alkalmazsnak generlsra egy j llapottmenet-fggvnyt definilnnk, akkor
minden, a 3. s 4. fejezetbeli keres algoritmust felhasznlhatnnk a bizonyts megtallsra. A bizonyts
keresse teht egy alternatvja a modellek felsorolsnak. A keress haladhat elrefel a kezdeti tudsbzisbl
kiindulva, alkalmazva a kvetkeztetsi szablyokat a clmondat levezetshez, vagy mehet visszafel a
clmondatbl, megprblva megtallni a kvetkeztetsi szablyoknak olyan lncolatt, amely a kiindulsi
tudsbzisra alkalmazhat szablyokbl indul. A fejezetben ksbb bemutatunk kt olyan algoritmuscsaldot,
amelyek ezeket a technikkat hasznljk.
190
Created by XMLmind XSL-FO Converter.
Logikai gensek
Fontos
Az a tny, hogy a kvetkeztets az tletlogikban NP-teljes, azt sugallja, hogy a legrosszabb esetet
tekintve a bizonytsok keresse sem hatkonyabb a modellek felsorolsnl. Szmos gyakorlati
esetben azonban, bizonyts megtallsa sokkal hatkonyabb lehet, egyszeren azrt, mert kpes
figyelmen kvl hagyni az irrelevns lltsokat, fggetlenl attl, hogy hny van bellk. Pldul az
elz bizonyts, amely elvezetett a C1,2 C2,1 mondathoz, nem emlti az S2,1, C1,1, C2,2 vagy a C1,2
lltsokat. Ezeket azrt lehet figyelmen kvl hagyni, mert a C1,2 clllts csak az Sz2-ben jelenik meg,
az Sz2-ben szerepl egyb lltsok pedig csak az Sz2-ben s az Sz4-ben, gy az Sz1, Sz3 s Sz5
szablyoknak nincs kihatsuk a bizonytsra. Ugyanez maradna a helyzet, ha mg milli szablyt
hozzadnnk a tudsbzishoz, mikzben az igazsgtbla algoritmust ezzel ellenttben elrasztan a
modellek exponencilis robbansa.
A logikai rendszereknek ez a tulajdonsga valjban egy sokkal alapvetbb jellegzetessgkbl, a
monotonitsbl (monotonicity) kvetkezik. A monotonits azt mondja ki, hogy a vonzatmondatok halmaza
csak bvlhet, ha a tudsbzishoz informcit adunk hozz. 10
ha TB
akkor TB
Pldul felttelezzk azt, hogy a tudsbzis tartalmaz egy j lltst, amely azt mondja ki, hogy pontosan 8
csapda van a vilgban. Ez a tuds segtheti az genst tovbbi konklzik levezetsben, de nem teheti
rvnytelenn egyik korbban kikvetkeztetett konklzit sem gy azt a konklzit sem, hogy nincsen
csapda az [1, 2]-ben. A monotonits azt jelenti, hogy a kvetkeztetsi szablyok brmikor alkalmazhatk, ha a
megfelel premisszk megtallhatk a tudsbzisban a szably konklzijnak kvetkeznie kell, fggetlenl
attl, hogy mi ms is van mg a tudsbzisban.
4.1. Rezolci
Megmutattuk, hogy az eddig ismertetett kvetkeztetsi szablyok helyesek, de nem trgyaltuk az ezeket
hasznl kvetkeztetsi algoritmusok teljessgnek krdst. A keressi algoritmusok, mint az iteratvan
mlyl keress 4.5. szakasz - Iteratvan mlyl mlysgi keress rszben teljesek abban az rtelemben, hogy
meg fogjk tallni az elrend clt. Ha azonban a rendelkezsre ll szablyok hinyosak, akkor a cl nem
rhet el nem ltezik olyan bizonyts, amely csak ezeket a szablyokat hasznlja. Pldul ha kivennnk az
ekvivalencia kikszbls szablyt, az elz fejezetbeli bizonyts nem futna vgig. Ez a fejezet egyetlen
kvetkeztetsi szablyt mutat be, a rezolcit (resolution), amelynek alkalmazsa, prostva brmelyik teljes
keressi mdszerrel, egy teljes kvetkeztetsi algoritmust eredmnyez.
Elszr a rezolcis szably egy egyszer vltozatt fogjuk hasznlni a wumpus vilgban. Nzzk meg a 7.4.
(a) brhoz vezet lpseket: az gens visszafordul a [2, 1]-bl az [1, 1]-be, s innen megy az [1, 2]-be, ahol
szellt rez, de bzt nem. A kvetkez tnyeket adjuk hozz a tudsbzishoz:
Sz11: S1,2
Sz12: S1,2 (C1,1 C2,2 C1,3)
Ugyanazzal a folyamattal, amely az Sz10-hez vezetett korbban, most le tudjuk vezetni, hogy nincs csapda a [2,
2]-ben s az [1, 3]-ban (emlkezznk, hogy mr tudjuk, hogy az [1, 1] csapdamentes):
Sz13: C2,2
Sz14: C1,3
Az Sz3-ra is alkalmazhatjuk az ekvivalencia kikszblst, amelyet egy Modus Ponens kvet az Sz5-re, hogy
megkapjuk azt a tnyt, hogy csapda van az [1, 1], a [2, 2] vagy a [3, 1] ngyzetekben:
Sz15: C1,1 C2,2 C3,1
A nemmonoton logikk (nonmonotonic logics), amelyek megszegik a monotonits tulajdonsgot, az emberi rvelsnek azt a szokvnyos
tulajdonsgt jelentik meg, amikor valaki meggondolja magt. Ezeket a 10.7. alfejezetben trgyaljuk.
10
191
Created by XMLmind XSL-FO Converter.
Logikai gensek
Most kvetkezik a rezolci szably els alkalmazsa: a C2,2 literl az Sz13-ban rezolvl a C2,2 literllal az Sz15ben, amely ezt adja:
Sz16: C1,1 C3,1
Magyarul, ha van egy csapda az [1, 1], [2, 2], [3, 1] ngyzetek egyikben, s ez a csapda nem a [2, 2]-ben van,
akkor ez az [1, 1]-ben vagy a [3, 1]-ben van. Hasonlan a C1,1 literl az Sz1-ben rezolvl a C1,1 literllal az Sz16ban, amibl addik:
Sz17: C3,1
Teht, ha van egy csapda az [1, 1]-ben vagy a [3, 1]-ben, s ez a csapda nem az [1, 1]-ben van, akkor ez a [3, 1]ben van. Ez az utols kt kvetkeztetsi lps plda az egysgrezolci (unit resolution) kvetkeztetsi
szablyra,
ahol egy literl, i s m pedig kiegszt literlok (complementary literals) (pldul az egyik negltja a
msiknak). Teht az egysgrezolci vesz egy klzt (clause) literlok diszjunkcijt meg egy literlt, s
ltrehoz egy j klzt. Vegyk szre, hogy egy egyedi literlt tekinthetnk egy literl diszjunkcijnak, amit
szoktak egysgklznak (unit clause) is nevezni.
Az egysgrezolci szablya ltalnosthat teljes rezolcis (resolution) szablly,
ahol i s mj kiegszt literlok. Ha csak kett hosszsg klzokkal foglalkozunk, akkor ezt rhatjuk:
Azaz a rezolci vesz kt klzt, s ltrehoz egy j klzt, amely tartalmaz minden literlt az eredeti kt klzbl,
kivve a kiegszt literlokat. Pldul:
Van mg egy technikai aspektusa a rezolcis szablynak: az eredmnyklznak minden literlnak csak egy
pldnyt kell tartalmaznia.11 A literlok tbbszrs pldnyainak kivonst faktorls (factoring) hvjk.
Pldul ha rezolvljuk az (A B)-t a (A B)-vel, akkor (A A)-t kapunk, amelyet reduklhatunk egyszeren
A-ra.
A rezolcis szably helyessge egyszeren belthat, ha megvizsgljuk az li literlt. Ha li igaz, akkor mj hamis,
s gy m1 mjl mj+l mn-nek igaznak kell lennie, mert m1 mn adott. Ha i hamis, akkor 1
il i+l k igaz kell, hogy legyen, mivel i k adott. gy i akr igaz, akr hamis, az egyik
vagy a msik konklzi ll, pontosan gy, ahogy a szably ezt kimondja.
Fontos
Ami mg meglepbb a rezolcis szabllyal kapcsolatban, hogy a rezolci alapjul szolgl teljes
kvetkeztetsi algoritmusok egy csaldjnak. Brmely teljes keressi algoritmus, a rezolcis szablyt
alkalmazva, az tletlogikban kpes levezetni brmilyen konklzit, amely vonzata a tudsbzisnak.
Egy figyelmeztets: a rezolci csak egy specilis rtelemben teljes. Ha adott, hogy A igaz, akkor nem
tudjuk a rezolcit arra hasznlni, hogy levezessk az A B konzekvencit. Azonban tudjuk arra
hasznlni a rezolcit, hogy megvlaszoljuk azt a krdst, hogy A B igaz-e. Ezt megcfolsi
teljessgnek (refutation completeness) nevezik, ami azt jelenti, hogy a rezolci mindig hasznlhat
Ha a klzt literlok halmaznak tekintjk, akkor ezt a korltozst automatikusan figyelembe vettk. A halmaz jellst alkalmazva a
klzokra a rezolcis szably sokkal tisztbb lesz egy jabb jells bevezetsnek rn.
11
192
Created by XMLmind XSL-FO Converter.
Logikai gensek
arra, hogy megerstsnk vagy megcfoljunk egy mondatot, de nem alkalmazhat az igaz mondatok
felsorolsra. A kvetkez kt alfejezet azt magyarzza el, hogy a rezolci hogyan oldja ezt meg.
Fontos
A rezolcis szably csak literlok diszjunkciira alkalmazhat, gy gy tnhet, hogy ez csak olyan
tudsbzis s lekrdezs esetben rdekes, amelyek ilyen diszjunkcikat tartalmaznak. Akkor hogyan
vezet ez egy teljes kvetkeztetsi eljrshoz az egsz tletkalkulus szmra? A vlasz az, hogy minden
tletkalkulus mondat logikailag ekvivalens literlok diszjunkciinak konjunkciival. Egy mondatot,
amelyet literlok diszjunkciinak konjunkciival fejeznk ki, konjunktv norml formjnak
(conjunctive normal form) vagy CNF formjnak neveznk. A ksbbiekben az is hasznos lesz, ha
ennek egy korltosabb csaldjt, a k-CNF mondatokat tekintjk. Egy mondat a k-CNF-be tartozik, ha
pontosan k literl van a klzokban.
( l, l 1, k) (
n,
n, k)
Ki fog derlni, hogy minden mondat transzformlhat 3-CNF mondatt gy, hogy azonos marad a modellek
halmaza.
Ahelyett hogy bizonytannk ezeket a kijelentseket (lsd 7.10. feladat), lerunk egy egyszer konvertl
eljrst. Az eljrst az Sz2 szably, az S1,1 (C1,2 C2,1) mondat CNF-re konvertlsval illusztrljuk. A lpsek
a kvetkezk:
1. Kszbljk ki a sszektjelet, helyettestve az -t ( ) ( )-vel:
(S1,1 (C1,2 C2,1)) ((C1,2 C2,1) S1,1)
3. A CNF megkvnja, hogy a csak literlokra vonatkozzon, gy most a-t beljebb mozgatjuk a kvetkez
7.11. brn felrt ekvivalencik ismtelt alkalmazsval:
()
( ) (
) De Morgan
( ) ( ) De Morgan
4. Most van egy mondatunk, amelyben egymsba gyazott s opertorok vannak alkalmazva a literlokra.
A 7.11. brn bevezetett disztributivits szablyt alkalmazzuk a opertorokra az felett mindenhol, ahol
lehetsges.
(S1,1 C1,2 C2,1) (C1,2 S1,1) (C2,1 S1,1)
Az eredeti mondat most mr CNF-ben van, hrom klz konjunkcijaknt. Br sokkal nehezebb olvasni ezt a
formt, de hasznlhat a rezolcis eljrs bemeneteknt.
193
Created by XMLmind XSL-FO Converter.
Logikai gensek
A rezolci algoritmust mutatja a 7.12. bra. Elszr a (TB )-t konvertljuk CNF formra. Majd a
rezolcis szablyt alkalmazzuk a ltrejv klzokra. Minden egyes prt, amely kiegszt literlokat tartalmaz,
rezolvlunk, hogy egy j klzt hozzunk ltre, amelyet hozzadunk a halmazhoz, ha mg nem volt jelen. A
folyamat addig folytatdik, amg a kvetkez kt dolog kzl valamelyik meg nem trtnik:
nincs tbb j klz, amit hozz lehet adni, ilyen esetben nem vonzza maga utn -t.
a rezolci alkalmazsa egy res klzra vezet, amely esetben -nak vonzata .
Az res klz egy diszjunkt nlkli diszjunkci ekvivalens a Hamis rtkkel, mert a diszjunkci akkor igaz
csak, ha legalbb az egyik diszjunkt igaz. gy is belthatjuk, hogy az res klz ellentmondst reprezentl, hogy
megfigyeljk azt, hogy az res klz kt kiegszt egysgklz, mint amilyen az S s S, rezolvlsbl
szrmazik.
Alkalmazzuk a rezolcis eljrst egy nagyon egyszer kvetkeztetsre a wumpus vilgban. Amikor az gens az
[1,1]-ben van, akkor nincs szell, teht nincs csapda a szomszdos ngyzetekben. Az ennek megfelel
tudsbzis:
TB = Sz2 Sz4 = (S1,1 (C1,2 C2,1)) S1,1
s mi bizonytani szeretnnk -t, ami mondjuk C1,2. Amikor konvertljuk a (TB )-t CNF formra, akkor a
7.13. bra fels rszn lthat klzokat kapjuk. Az bra msodik sora mutatja az sszes klzt, amit az els sor
prjainak rezolvlsbl kaptunk. s akkor, amikor a C1,2-t rezolvljuk C1,2-vel megkapjuk az res klzt, amit
egy kis ngyzet jell. A 7.13. bra megvizsglsa azt mutatja, hogy szmos rezolcis lps felesleges. Pldul
az S1,1 S1,1 C1,2 ekvivalens az Igaz C1,2-vel, ami ekvivalens az Igazzal. Levezetni, hogy az Igaz az igaz,
nem igazn hasznos. gy brmely olyan klz, amelyben kt kiegszt klz szerepel, figyelmen kvl hagyhat.
194
Created by XMLmind XSL-FO Converter.
Logikai gensek
195
Created by XMLmind XSL-FO Converter.
Logikai gensek
1. Minden Horn-klz felrhat egy implikciknt is, amelynek premisszja pozitv literlok konjunkcija, s
konklzija egyetlen pozitv literl (lsd 7.12. feladat). Pldul a (P1,1 Szell S1,1) Horn-klz trhat a
(P1,1 Szell) S1,1 implikcira. Ebben az utbbi formjban sokkal knnyebb olvasni a mondatot: azt
mondja ki, hogyha az gens az [1, 1]-ben van, s szell rzkelhet ott, akkor az [1, 1] szells. Szmos
terleten az emberek szmra knny a tudst ilyen mondatok formjban olvasni s lerni.
A Horn-klzokat, mint amilyen az elbbi, vagyis amelyben pontosan egy pozitv literl van, hatrozott
klzoknak (definite clauses) nevezik. A pozitv literl a fej (head), mg a negatv literlok alkotjk a klz
testt (body). Egy negatv literlok nlkli hatrozott klz egyszeren kijelent egy adott lltst, amit
gyakran tnynek (fact) neveznek. A hatrozott klzok formljk a logikai programozs (logic
programming) alapjt, amelyet a 9. fejezetben trgyalunk. Egy pozitv literlok nlkli Horn-klz felrhat,
mint egy olyan implikci, amelynek a konklzija a Hamis literl. Pldul a (W1,1 W1,2) klz a
wumpus nem lehet mind az [1, 1], mind az [1, 2] mezben, ekvivalens a W1,1 W1,2 Hamis mondattal. Az
ilyen mondatokat integrits knyszereknek (integrity constraints) nevezzk az adatbzis-kezels terletn,
ahol adathibk jelzsre hasznljk. A kvetkezkben bemutatsra kerl algoritmusokban az egyszersg
kedvrt felttelezzk, hogy a tudsbzis csak hatrozott klzokat tartalmaz, s nincsenek benne
integritsknyszerek. Azt mondjuk, hogy ezek a tudsbzisok Horn-formban vannak.
2. A Horn-klzokon trtn kvetkeztets trtnhet az elrefel lncols (forward chaining) vagy a htrafel
lncols (backward chaining) algoritmusokkal, amelyeket a kvetkezkben elmagyarzunk. Mindkt
algoritmus igen termszetes, a kvetkeztetsi lpsek nyilvnvalak s egyszeren kvethetek az emberek
szmra.
3. A maga utn vonzs krdsnek eldntshez szksges id linerisan fgg a tudsbzis mrettl.
196
Created by XMLmind XSL-FO Converter.
Logikai gensek
Ez az utols tny egy kellemes meglepets. Azt jelenti, hogy a logikai kvetkeztets nagyon olcs szmos, a
gyakorlatban elfordul tletkalkulus tudsbzis esetben.
Az IK-EL-VONZAT? (TB, q) elrefel lncolsi algoritmus meghatrozza, hogy egy q tletkalkulus szimblum
a lekrdezs vonzata-e egy Horn-klzokat tartalmaz tudsbzisnak. Az algoritmus a tudsbzisban tallhat
ismert tnyekbl (pozitv literlok) indul ki. Ha egy implikci minden premisszja ismert, akkor a konklzijt
hozzadjuk az ismert tnyek halmazhoz. Pldul, ha ismert a P1,1, s a Szell s a (P1,1 Szell) S1,1 a
tudsbzisban van, akkor S1,1-t hozzadhatjuk ehhez. Ez a folyamat folytatdik, amg vagy a q lekrdezst hozz
tudjuk adni az ismert tnyek halmazhoz, vagy mr nem tudunk tovbbi kvetkeztetst vgezni. A rszletes
algoritmust a 7.14. bra mutatja, a legfontosabb tulajdonsg, amire emlkeznnk kell, hogy ez lineris idben
fut.
Az algoritmust a legjobban gy rthetjk meg, ha megnznk egy pldt s egy hozz tartoz brt. A 7.15. (a)
bra egy egyszer Horn-klzokbl ll tudsbzist mutat be, amely az A s B ismert tnyeket tartalmazza. A
7.15. (b) bra ugyanezt a tudsbzist egy S-VAGY grfknt (AND-OR graph) brzolja. Az S-VAGY
grfokban a konjunkcikat vekkel sszefogott kapcsolatok minden egyes kapcsolatot bizonytani kell
jellik, mg a diszjunkcikat vek nlkl sszefut kapcsolatok elg valamelyik kapcsolatot bizonytani
jellik. Knny ttekinteni, hogyan is mkdik az elrefel lncols a grfon. Az ismert levelek (itt A s B)
adottak, s a kvetkeztets addig halad felfel a grfon, amg lehetsges. Brhol megjelenik egy konjunkci a
folyamatban, a tovbbterjeszts megll addig, amg az sszes konjunkt ismertt nem vlik, majd ezutn halad
tovbb. Javasoljuk az olvasnak, hogy vegye t rszletesen a pldt.
7.15. bra - (a) Egyszer Horn-klzokbl ll tudsbzis. (b) Ugyanez a tudsbzis SVAGY grfknt.
197
Created by XMLmind XSL-FO Converter.
Logikai gensek
Fontos
Knny beltni, hogy az elrefel lncols helyes: minden kvetkeztets valjban a Modus Ponens
egy alkalmazsa. Az elrefel lncols teljes is: minden vonzat atomi mondatot vezet le. A
legegyszerbben gy rthetjk meg ezt, ha a kikvetkeztetett llapot tbla vgs llapott tekintjk
(miutn az algoritmus elrt egy fix pontot (fixed point), ahol mr jabb kvetkeztets nem lehetsges).
A tbla igaz rtket tartalmaz minden, a folyamat sorn kikvetkeztetett szimblumra, s hamis rtket
a tbbi szimblumra. A tblt gy tekinthetjk, mint egy logikai modellt, radsul minden hatrozott
klz az eredeti TB-ben igaz ebben a modellben. Ennek beltsra felttelezzkaz ellenkezjt,
nevezetesen, hogy valamely a1 ak klz hamis a modellben. Ez azt jelenti, hogy a1
ak-nak igaznak, mg -nek hamisnak kell lennie a modellben. Ez viszont ellentmond annak a
felttelezsnknek, hogy az algoritmus elrte a fix pontot! gy levonhatjuk azt a kvetkeztetst, hogy a
kikvetkeztetett atomi mondatok halmaza a fix pontban az eredeti TB egy modelljt definilja.
Ezenkvl, brmely q atomi mondatnak, amely vonzata a TB-nek, igaznak kell lennie ennek minden
modelljben, gy ebben az emltett modellben is. Ennlfogva az algoritmusnak ki kell kvetkeztetnie
minden q vonzat mondatot.
Az elrefel lncols egy pldja az ltalnos adatvezreltnek (data-driven) nevezett kvetkeztetsi elvnek,
amely olyan kvetkeztetseket jelent, ahol a figyelem fkusza kezdetben az ismert adatokon van. Ez a
megkzelts alkalmazhat az genseknl a bejv rzetekbl trtn kvetkeztetsek levezetsre, gyakran
anlkl is, hogy valamilyen krds lebegne a szemnk eltt. Pldul a wumpus gens KIJELENT-heti az rzeteit
a tudsbzisnak, felhasznlva egy inkrementlis elrefel kvetkeztet algoritmust, amelyben j tnyeket lehet
felvenni egy eljegyzsi listra, hogy tovbbi kvetkeztets inicializldjon. A mindennapi letben, jelents
szmban fordul el adatvezrelt kvetkeztets, amikor j informcik rkeznek. Pldul ha bent vagyok a
szobban s hallom, hogy elkezd esni, akkor felmerlhet bennem, hogy a tervezett kirnduls elmarad.
Ugyanakkor az valsznleg nem fog megfordulni a fejemben, hogy a szomszd kertjben a legnagyobb rzsa
tizenhetedik szirma nedves lesz. Az emberek vatos kontroll alatt tartjk az elrefel lncolst, nehogy
elrasszk ket az irrelevns kvetkezmnyek.
A visszafel lncols algoritmus, ahogy azt a neve is sugallja, visszafel mkdik a lekrdezsbl indulva. Ha a
q lekrdezsrl tudjuk, hogy igaz, akkor nem szksges tovbbi munka. Egybknt az algoritmus megtall
198
Created by XMLmind XSL-FO Converter.
Logikai gensek
Logikai gensek
egysg klzz vlik, mivel ekvivalens a (Hamis C)-vel, azaz a C-vel. Termszetesen ahhoz, hogy ez a
klz igaz legyen, C-nek hamis rtket kell adni. Az egysgklz heurisztika elvgzi ezeket a
hozzrendelseket, mieltt elgazna a maradkon. Egy fontos konzekvencija ennek a heurisztiknak, hogy
brmely, mr a tudsbzisban tallhat literlra vonatkoz (cfolat ltali) bizonytsi ksrlet azonnal sikeres
lesz (7.16. feladat). Vegyk szre azt is, hogy rtket adva egy egysgklzhoz jabb egysgklzt hozhatunk
ltre. Pldul amikor C-nek hamis rtket adunk, akkor a (C A) egysgklzz vlik, ami az igaz A-hoz val
hozzrendelst eredmnyezi. Ezt az egymst kvet kiknyszertett hozzrendelsek sorozatt
egysgterjesztsnek (unit propagation) nevezik. Hasonlt a folyamat a Horn-klzokkal trtn elrefel
lncolsra, s valban, abban az esetben ha a CNF formj kifejezs csak Horn-klzokat tartalmaz, akkor a
DPLL lnyegben lemsolja az elrefel lncolst (lsd 7.17. feladat).
A DPLL algoritmust mutatja a 7.16. bra. Az brn a lnyeges elemeket tartalmaz vzat adtuk meg, ami
bemutatja magt a keressi folyamatot. Nem szerepel az adatstruktra lersa, amelyet fenn kell tartani, hogy a
keressi lpseket hatkonyan lehessen elvgezni, sem azoknak a trkkknek a lersa, amelyeket a teljestmny
fokozsa cljbl az alapalgoritmushoz hozz lehet adni: klztanuls, vltoz vlasztsi heurisztika s a
vletlenszer jraindtsok technikja. Ha ezeket is beptjk az algoritmusba, akkor a DPLL az egyik
leggyorsabb kielgthetsgi algoritmus, antikvitsa ellenre is. A CHAFF implementci milli vltozs
hardververifikcis problmk megoldsra szolglt.
Logikai gensek
szksgesek. Az utbbi vekben nagyon sokat foglalkoztak azzal a krdssel, hogy hogyan lehet egy j
egyenslyt tallni a mohsg s a vletlenszersg kztt.
Az egyik legegyszerbb s leghatkonyabb algoritmus, amely ezen munkk kztt felbukkant a WALKSAT (7.17.
bra). Minden iterciban az algoritmus vesz egy kielgtetlen klzt s egy szimblumot a klzbl, amelynek
rtkt ellenkezre cserli. Az rtket cserl szimblum kivlasztsa a kvetkez kt mdszer kzl
vletlenszeren vlasztva az egyikkel trtnik: (1) a min-konfliktus lps, amely minimalizlja a
kielgtetlen klzokat az j llapotban, s a (2) vletlen-bejrs, amely vletlenszeren vlasztja a
szimblumot.
Mkdik-e egyltaln a WALKSAT? Az egyrtelm, hogy ha visszaad egy modellt, akkor a bemeneti mondat
valban kielgthet. Mi van akkor, ha kudarccal tr vissza? Sajnos ebben az esetben nem tudjuk megmondani,
hogy a mondat kielgthetetlen vagy az algoritmus szmra tbb idt kellene hagyni a keressre.
Megprblhatjuk belltani a max_csere rtkt vgtelenre. Erre az esetre knny megmutatni, hogy a WALKSAT
vgl vissza fog adni egy modellt (ha ltezik ilyen), feltve, hogy a p valsznsgre igaz a p > 0. Ez azrt van
gy, mert mindig ltezik egy olyan cserlsi sorozat, amely elvezet egy kielgt hozzrendelshez, s elbbutbb a vletlen bejrs lpsek el fogjk lltani ezt a sorozatot. Persze ha a max_csere vgtelen, s a mondat
kielgthetetlen, akkor az algoritmus soha nem fog lellni!
Ezek az eredmnyek azt sugalljk, hogy a loklis keressi algoritmusok, mint a WALKSAT, akkor a leginkbb
hasznosak, ha felttelezhetjk, hogy ltezik megolds mint pldul a 3. s 5. fejezetben trgyalt problmknak
ltalban van megoldsuk. Viszont a loklis keress nem kpes detektlni a kielgthetetlensget, amely
szksges a maga utn vonzs krdsnek az eldntshez. Pldul egy loklis keresst alkalmaz gens nem
tudja megbzhatan bizonytani, hogy egy ngyzet biztonsgos a wumpus vilgban. Ehelyett azt tudja mondani,
hogy Egy rja gondolkodom a krdsen, s nem tudtam olyan lehetsges vilgot tallni, amiben a ngyzet
nem biztonsgos. Ha a loklis keress algoritmus ltalban igazn gyors egy modell megtallsban, ha ltezik
ilyen, akkor az genst tekinthetjk igazolhatnak, felttelezve, hogy a kudarc a kielgthetetlensget jelzi. Ez
termszetesen nem azonos egy bizonytssal, s az gensnek ktszer is meg kell gondolnia, mieltt erre bzza az
lett.
201
Created by XMLmind XSL-FO Converter.
Logikai gensek
Amikor konjunktv norml formban lev kielgthetsgi problmkat tekintnk, alulhatrozott problma az,
amelyben viszonylag kevs a vltozkat korltoz klz szerepel. Pldul itt van egy vletlenszeren ltrehozott 12
3-CNF mondat t szimblummal s t klzzal:
(D B C) (B A C) (C B E) (E D B) (B E C)
12
Minden klz hrom vletlenszeren kivlasztott szimblumot tartalmaz, amelyek 50% valsznsggel negltak.
202
Created by XMLmind XSL-FO Converter.
Logikai gensek
Az gens minden [x, y] ngyzetre ismer egy mondatot, ami azt jelenti ki, hogy a bz hogyan ered:
Bx,y (Wx,y+1 Wx,y1 Wx+1,y Wx1,y) (7.2)
Vgl tudja, hogy pontosan egy wumpus van. Ezt kt rszben fejezzk ki. Elszr ki kell jelentennk, hogy
legalbb egy wumpus van:
W1,1 W1,2 W4,3 W4,4
Ezutn azt kell mondanunk, hogy legfeljebb egy wumpus van. Az egyik lehetsges mdja ennek, hogy minden
kt mezre kijelentjk, hogy a kt mez egyiknek wumpusmentesnek kell lennie. Ha n ngyzet van, akkor n(n
1)/2 mondatot kapunk, olyanokat mint a W1,1 W1,2. Egy 4 4-es vilg esetben, gy sszesen 64
klnbz szimblumot tartalmaz 155 mondattal kezdnk.
Az gensprogram, amelyet a 7.19. bra mutat, KIJELENTI a tudsbzisnak az sszes szell s bz rzetet.
(Ezenkvl frissti nhny hagyomnyos vltozjnak rtkt is, amelyek azt rzik, hogy az gens merre van
most s merre jrt korbban erre ksbb mg visszatrnk). Ezutn a program kivlasztja, hogy melyik cellt
nzze meg a peremen lvk kzl olyan ngyzetek kzl, amelyek szomszdosak valamelyik megltogatottal.
Egy peremen lv [x, y] cella bizonythatan biztonsgos, ha a (Ci,j Wi,j) mondat vonzata a tudsbzisnak.
A msodik legjobb dolog, ha egy cella lehetsges, hogy biztonsgos, amikor az gens nem tudja bizonytani,
hogy ott egy csapda vagy egy wumpus van azaz, hogy a (Ci,j Wi,j) nem vonzat.
A KRDEZ eljrsban lev maga utn vonzs szmtsa implementlhat a fejezetben korbban bemutatott a
mdszerek kzl brmelyikkel. Az IT-VONZAT? (7.10. bra) nyilvn nem praktikus, mivel fel kellene sorolni a
264 sort. A DPLL (7.16. bra) nhny milliszekundum alatt vgrehajtja a kvnt kvetkeztetst, leginkbb az
egysg-propagci heurisztiknak ksznheten. A WALKSAT szintn hasznlhat, a teljessg hinybl
szrmaz gyengesgeivel. A wumpus vilgokban, a modell megtallsnak kudarca, 10 000 csert felttelezve,
praktikusan megfelel a kielgthetetlensgnek, gy nem valszn, hogy hiba fordulhatna el a teljessg hinya
miatt.
203
Created by XMLmind XSL-FO Converter.
Logikai gensek
Az IK-WUMPUS-GENS igen jl mkdik kismret wumpus vilgban. Azonban mgis van valami ersen nem
megnyugtat az gens tudsbzisval kapcsolatban. A TB tartalmazza a fizikai lerst a (7.1) s (7.2) alak
egyenletek formjban minden egyes ngyzetre. Minl nagyobb a krnyezet, annl nagyobb kezdeti tudsbzisra
van szksg. Sokkal inkbb azt szeretnnk, hogy csak kt mondatunk lenne, amelyek kimondjk, hogy hogyan
is keletkezhet a szell vagy a bz brmely kockban. Ez mt tl van az tletkalkulus kifejezsi kpessgn. A
kvetkez fejezetben ltni fogunk egy nagyobb kifejezervel rendelkez logikai nyelvet, amelyben egyszer
lesz ilyen mondatot kijelenteni.
Azonnal lthatjuk, hogy ez nem fog mkdni. Ha az gens kiindul az [1, 1]-bl arccal jobbra s halad abban az
irnyban, akkor a tudsbzisbl kvetkezni fog a H1,1 (az eredeti elhelyezkeds) s a H2,1 (az j elhelyezkeds).
Mgsem lehet azonban mindkt llts igaz! A problma az, hogy az elhelyezkeds lltsoknak kt klnbz
idpontra kell vonatkozniuk. Szksgnk van egy
s gy tovbb. Az lthat, hogy igen gyesnek kell lennnk egy teljes s helyes tudsbzis felptshez, hogy
mindent nyomon kvessnk a wumpus vilgban; ennek teljes trgyalst elhalasztjuk a 10. fejezetig. A lnyeg,
amire itt r akartunk mutatni, hogy a kezdeti tudsbzis tartalmazni fog olyan mondatokat, mint az elz kt
plda, minden t idpontra s minden helyre is. Ami azt jelenti, hogy minden t idpontra s [x,y] helyre a
tudsbzis tartalmaz egy kvetkez formj mondatot:
A figyelmes olvas szreveszi, hogy ez megengedte szmunkra azt, hogy gyeskedjnk a nyers rzet, mint a Szell, s a helyspecifikus
llts, mint az S1,1, kztti kapcsolattal.
13
204
Created by XMLmind XSL-FO Converter.
Logikai gensek
Mg akkor is, ha fels korltot szabunk a megengedett lpsek szmnak 100-at taln mondatok tzezreihez
jutunk. Ugyanez a problma merl fel, ha minden idlpshez is hozzadunk mondatokat, ahogy szksges. A
klzoknak ez az elburjnzsa olvashatatlann teszi szmunkra a tudsbzist, de a gyors tletkalkulus megoldk
mg gy is knnyen tudjk kezelni a 4 4-es wumpus vilgot (korltaikat a 100 100-as mret krl rik el).
Az ramkrre alapul gens, amit a kvetkez alfejezet mutat be, rszleges megoldst knl a klzok
elburjnzsnak problmjra, de a teljes megoldsra vrnunk kell, mg nem alkalmazzuk az elsrend logikt
majd a 8. fejezetben.
205
Created by XMLmind XSL-FO Converter.
Logikai gensek
bra egy pldt mutat. Az lve rtkt a Sikoly negltjnak s az lve ksleltetett rtknek a konjunkcija adja.
lltsokban megfogalmazva ez a hlzat az lve fogalomra megvalstja a kvetkez ekvivalencit:
lvet Sikolyt lvet1 (7.4)
amely mondat azt mondja ki, hogy a wumpus a t idpontban akkor s csakis akkor l, ha nem szleltnk sikolyt
a t idpillanatban (egy t 1 idpontbeli sikoly alapjn) s lt a t 1 idpillanatban. Felttelezzk, hogy az
ramkrben az lve regiszter igazra van inicializlva. gy az lve igaz marad mindaddig, amg nincs egy sikoly,
amikor is hamiss vlik s a ksbbiekben hamis marad. Ez pont az, amit mi akarunk.
7.21. bra - Egy ramkr, amely meghatrozza, hogy az gens az [1, 1]-ben van-e.
Minden pozci s orientci regiszterhez egy hasonl ramkr csatlakozik.
Az gens helyzete nagyon hasonl mdon kezelhet, mint a wumpus halla. Szksgnk van egy Hx,y regiszterre
minden x-hez s y-hoz, s ennek az rtke igaz kell, hogy legyen, amikor az gens az [x, y]-ban van. Az
ramkr, amelyik belltja Hx,y rtkt azonban sokkal bonyolultabb, mint az lve ramkre. Pldul az gens az
[1, 1]-ben van a t idpontban, ha (a) az ott volt a t 1-ben s vagy nem haladt semerre, vagy megprblta, de
falnak tkztt; vagy (b) az [1, 2]-ben volt arccal lefel s haladt elrefel; vagy (c) a [2, 1]-ben volt arccal balra
s haladt elre:
A H1,1 hlzata a 7.21. brn lthat. Minden elhelyezkeds regiszterhez egy hasonl ramkr tartozik. A 7.13.
(b) feladatban azt krjk, hogy ksztsen ramkrt az irnyra vonatkoz lltsokhoz.
A 7.20. s 7.21. brkon lev ramkrk fenntartjk az lve s a Hx,y igazsgrtkt minden idpillanatban. Egy
ilyen ramkr ltal reprezentlt lltsok szokatlanok azonban abban az rtelemben, hogy a helyes
igazsgrtkeiket minden pillanatban meg tudjuk hatrozni. Tekintsk az elz helyett az S4,4 lltst: a [4,
4] ngyzet szells. Habr az lltsnak az igazsgrtke
rgztve van valamilyen rtken, az gens nem ismerheti az igazsgrtket mindaddig, amg meg nem ltogatja
a [4, 4] mezt (vagy ki nem kvetkezteti, hogy van egy szomszdos csapda). Az tletlogikt s az elsrend
logikt igaz, hamis s ismeretlen rtk lltsok automatikus reprezentlsra terveztk, de az ramkrket
nem: az S4,4 regiszternek tartalmaznia kell valamely rtket, vagy igaz vagy hamis rtket, mg mieltt az
igazsgot feltrjk. A regiszterbeli rtk lehet helytelen, s ez helytelen irnyba is vezetheti az genst. Ms
206
Created by XMLmind XSL-FO Converter.
Logikai gensek
szavakkal, szksgnk volna hromfle lehetsges llapot reprezentlsra (S4,4 ismerten igaz, ismerten hamis
vagy nem ismert), s csak egy bitnk van arra, hogy megoldjuk ezt.
A megolds erre a problmra az, hogy hasznljunk kt bitet egy helyett. Az S4,4-et reprezentlja kt regiszter,
amelyeket K(S4,4)-nek s K(S4,4)-nek neveznk, ahol K jelli azt, hogy ismert. (Emlkezznk, hogy ezek mg
mindig csak sszetett nevekkel rendelkez szimblumok, mg akkor is, ha strukturlt kifejezsnek tnnek!) Ha
mind K(S4,4) s K(S4,4) hamis, akkor ez azt jelenti, hogy az S4,4 igazsgrtke nem ismert. (Ha mindkett igaz,
akkor hiba van a tudsbzisban!) Ebben a reprezentciban brmikor is hasznlnnk az S4,4-et a hlzat valamely
rszben, a K(S4,4)-et hasznljuk helyette; s brmikor hasznlnnk az S4,4-et, akkor a K(S4,4)-et hasznljuk.
ltalnossgban, minden potencilis hatrozatlan lltst kt tudslltssal (knowledge propositions)
reprezentlunk, kijelentve, hogy a vonatkoz llts ismerten igaz vagy ismerten hamis.
Hamarosan ltni fogunk egy pldt arra, hogyan kell alkalmaznunk a tudslltsokat. Elszr is, szksgnk
van annak kidolgozsra, hogy hogyan hatrozzuk meg maguknak a tudslltsoknak az igazsgrtkt.
Vegyk szre, hogy mikzben az S4,4-nek rgztett igazsgrtke volt, a K(S4,4) s K(S4,4) vltozik, mikzben az
gens egyre tbbet tud meg a vilgrl. Pldul a K(S4,4) hamis rtkrl indul, s igazz vlik, amint az S4,4-rl
meghatrozhat, hogy igaz azaz, amikor az gens a [4, 4]-be lp, s detektlja a szellt. Majd igaz marad
ezutn. gy megllapthat, hogy
Egy csapda adott ngyzetben val jelenltnek a meghatrozsa sokkal nehezebb szellnek kell lennie egy
szomszdos ngyzetben, de olyan szellnek, amely nem egy msik csapda miatt keletkezett:
K(C4,4)t (K(S3,4)t K(C2,4)t K(C3,3)t) (7.8)
(K(S4,3)t K(C4,2)t K(C3,3)t)
Fontos
Mikzben egy kicsit zavaros a csapdk jelenltnek s hinynak bizonytsa az ramkrk hasznlata
esetben, az ramkr konstans szm kaput hasznl minden egyes ngyzethez. Ez a tulajdonsg
alapveten fontos ahhoz, hogy olyan ramkrn alapul genst ptsnk, amelynek bonyolultsga
kezelhet mdon n a problma mretvel. Ez valjban magnak a wumpus vilgnak a jellemzje; azt
mondjuk, hogy egy krnyezet lokalits (locality) tulajdonsgot mutat fel, ha igaz, hogy brmelyik
vizsgland llts igazsgnak meghatrozshoz csak egy konstans szm msik llts
megvizsglsa szksges. A lokalits tulajdonsg nagyon rzkeny a krnyezet pontos fizikjra.
Pldul az aknakeres trgyterlet (7.11. feladat) nemloklis, mert az akna egy adott ngyzetbeli
ltezsnek eldntse ignyelheti, hogy akrmilyen tvol lev ngyzetet is megnzznk. Nemloklis
trgyterletekre az ramkrre alapul gens alkalmazs nem mindig praktikus.
Van egy msik problma is, amely mellett eddig vatosan elmentnk: a hurokmentessg (acyclicity) krdse.
Az ramkrt hurokmentesnek tekintjk, ha minden olyan g, amely egy regiszter kimenett visszacsatolja a
bemenetre, tartalmaz legalbb egy kzbls ksleltet elemet. Megkveteljk, hogy minden ramkr
hurokmentes legyen, mivel a hurkokat tartalmaz ramkrk, mint fizikai eszkzk, nem mkdnek! Az ilyen
ramkr instabil oszcillciba kerlhet hatrozatlan rtkeket eredmnyezve. Pldaknt a hurkot tartalmaz
ramkrkre, tekintsk a (7.6) egyenletnek a kvetkez kibvtst:
K(S4,4)t K(S4,4)t1 (H4,4t Szellt) K(C3,4)t K(C4,3)t (7.9)
A hozzadott diszjunktok, a K(C3,4)t s a K(C4,3)t lehetv teszik az gens szmra, hogy a szell jelenltt
meghatrozza a szomszdos ngyzetekben lev csapdk jelenltbl, ami teljesen sszernek tnik. gy viszont
sajnos a szell tulajdonsg fgg a szomszdos csapdktl, s a csapdk fggenek a szomszdos ngyzetek szell
tulajdonsgtl, ahogy azt a (7.8) egyenlet lerja. Ezltal a teljes ramkr tartalmazna hurkot.
207
Created by XMLmind XSL-FO Converter.
Logikai gensek
A nehzsg nem az, hogy a (7.9) egyenlet nem helyes. A problma inkbb az, hogy az egyenletek ltal
reprezentlt fggsgek sszekapcsolsa nem oldhat fel az igazsgrtkek propaglsnak egyszer
mechanizmusval a vizsglt logikai ramkrkben. A (7.6) egyenletet alkalmaz hurokmentes verzi, amely a
szellssget a kzvetlen megfigyelsekbl hatrozza meg, nem teljes abban az rtelemben, hogy bizonyos
pontokon az ramkralap gens kevesebbet tud, mint a teljes kvetkeztetsi eljrst alkalmaz
kvetkeztetsalap gens. Pldul ha van szell az [1, 1]-ben, a kvetkeztetsalap gens kpes arra a
megllaptsra jutni, hogy van egy szell a [2, 2]-ben, mg a (7.6) egyenletet hasznl, hurokmentes ramkrre
alapul gens erre nem kpes. Lehetsges pteni egy teljes ramkrt vgl is, szekvencilis ramkrk
kpesek emullni brmilyen digitlis szmtgpet , de ez jelentsen bonyolultabb volna.
6.4. sszehasonlts
A kvetkeztetsalap s az ramkrn alapul gensek a deklaratv s procedurlis megkzelts szlssges
esetei az gens tervezsben. Szmos szempont szerint sszehasonlthatjuk ket:
Tmrsg. Az ramkrn alapul gensnek, ellenttben a kvetkeztetsalap genssel, nincs szksge a
tudsnak nll msolataira minden idlpsben. Ehelyett, mindig csak a pillanatnyi s a megelz
idlpsre hivatkozik. A fizika lershoz mindkt gensnek szksge van minden egyes ngyzetre
vonatkoz msolatokra (mondatok vagy ramkrk formjban), s gy nem knny nagyobb krnyezeteket
lerni. Azokban a krnyezetekben, ahol szmos objektum sszetett kapcsolatait kell lerni, a kijelentsek
szma elraszt brmilyen tletkalkulus genst. Ezek a krnyezetek mr ignylik az elsrend logika
kifejezerejt (lsd 8. fejezet). Mindkt tpus tletkalkulus gens rosszul alkalmazhat egy biztonsgos
ngyzettel szomszdos helyre vezet tvonal megtallsnak kifejezsre vagy megoldsra. (Emiatt az IKWUMPUS-GENS keressi algoritmusokat alkalmaz.)
Szmtsi hatkonysg. A legrosszabb esetben a kvetkeztets idignye exponencilisan fgg a szimblumok
szmtl, mg az ramkr futtatsa az ramkr mrettl linerisan fgg idt ignyel (vagy a mlysgtl
linerisan fgg idt, ha fizikai eszkzknt megvalstjuk). Lthattuk azonban, hogy a gyakorlatban a DPLL
igen gyorsan elvgezte a szksges kvetkeztetseket.14
Teljessg. Azt sugalltuk korbban, hogy az ramkralap gens lehet, hogy nem teljes a ciklusmentessggel
kapcsolatos korltozs miatt. A teljessg hinynak okai azonban mg alapvetbbek. Elszr is,
emlkezznk, hogy az ramkr a mretvel linerisan arnyos idben oldja meg a feladatot. Ez azt jelenti,
hogy bizonyos krnyezetek esetben egy teljes ramkrnek (egy olyannak, amely minden meghatrozhat
lltshoz kiszmtja az igazsgrtket) exponencilisan nagyobbnak kell lennie, mint a kvetkeztetsalap
gens tudsbzisnak. Egybknt lenne mdszernk arra, hogy hogyan oldjuk meg az tletkalkulus vonzat
problmjt kisebb mint exponencilis id alatt, ami nagyon valszntlen. A msodik rv az gens bels
llapotainak a jellege. A kvetkeztetsalap gens emlkezik minden rzetre, s implicit vagy explicit mdon
ismer minden mondatot, ami az rzetekbl s a kezdeti adatbzisbl kvetkezik. Pldul ha adott S1,1 s ismeri
a C1,2 C2,1 lltst, abbl S2,2 kvetkezik. Ezzel szemben az ramkralap gens elfelejt minden korbbi
rzetet s csak a regiszterekben trolt egyedi lltsokra emlkszik. Ekkppen az els rzet utn a C1,2 vagy a
C2,1 nmagban ismeretlen marad, s gy semmilyen kvetkeztets nem vonhat le S2,2-re vonatkozan.
A ltrehozs egyszersge. Ez egy nagyon fontos krds, amelyet nehz pontosan megtlni. A knyv
szerzje szmra a fizika lersa bizonyra sokkal egyszerbb deklaratv ton, mikzben kismret,
hurokmentes, majdnem teljes ramkrk tervezse a csapdk megtallsra igen nehznek bizonyult.
sszefoglalva, gy tnik, hogy ltezik kompromisszum a szmtsi hatkonysg, a tmrsg, a teljessg s a
knny ltrehozs kztt. Ha az rzetek s a cselekvsek kztti kapcsolat egyszer mint a Ragyogs vagy a
Megragad kztti kapcsolat esetben az ramkr optimlisnak tnik. Ennl bonyolultabb kapcsolatok
esetben a deklaratv megkzelts jobb lehet. Egy olyan terleten, mint a sakk pldul, a deklaratv szablyok
tmrek s knnyen kdolhatk (legalbbis az elsrend logikban), de a tbla llapotaibl a lpseket
kzvetlenl szmt hlzat elkpzelhetetlenl hatalmas lenne.
Eltr dolgokat ltunk ezekkel a megkzeltsekkel kapcsolatban az llatok vilgban. Az egyszer
idegrendszerrel rendelkez kisebb llatok valsznleg hlzatalapak, mg a magasabb rend llatok gy tnik,
hogy explicit reprezentcikon kvetkeztetseket vgeznek. Ez lnyegesen bonyolultabb gensfunkcik
szmtst teszi lehetv szmukra. Az emberek szintn rendelkeznek ramkrkkel, amelyek a reflexeket
Valjban minden olyan kvetkeztets, amely megvalsthat egy ramkrrel, megoldhat lineris idben a DPLL-lel. Ez azrt van gy,
mert egy ramkr kirtkelse hasonlt az elrefel lncolshoz, amely emullhat DPLL-lel az egysg propagci szably alkalmazsval.
14
208
Created by XMLmind XSL-FO Converter.
Logikai gensek
valstjk meg, s taln kpesek lefordtani (compile) deklaratv ismereteket ramkrkk, amikor bizonyos
kvetkeztetsek rutinn vlnak. Ily mdon egy hibrid gens (hybrid agent) tervezse (lsd 2. fejezet) lehet a
legjobb mindkt vilg szmra.
7. sszefoglals
Bevezettk a tudsbzis gens tlett, s megmutattuk, hogy hogyan tudunk olyan logikt definilni, amellyel
az gens kpes kvetkeztetni a vilgrl. A legfontosabb pontok a kvetkezk:
Az intelligens gensnek szksge van tudsra a vilgrl, hogy j dntseket hozhasson.
A tudst az gens egy tudsbzisban (knowledge base) egy tudsreprezentcis nyelv (knowledge
represantion language) mondatainak (sentences) formjban trolja.
Egy tudsbzis genst a tudsbzis s a kvetkeztetsi mechanizmus alkotja. Mkdsnek lnyege, hogy a
tudsbzisban a vilgot ler mondatokat trol s kvetkeztetsi mechanizmust alkalmaz j mondatok
kvetkeztetsre, majd felhasznlja ezeket cselekvsek meghatrozsra.
Egy reprezentcis nyelvet szintaxisa (syntax) s szemantikja (semantics) definil. A szintaxis a mondatok
struktrjt hatrozza meg, a szemantika a mondatok igazsgt (truth) hatrozza meg minden lehetsges
vilgban (world) vagy modellben (model),
A mondatok kztti vonzat (entailment) kapcsolatnak alapveten fontos szerepe van a kvetkeztets
megrtsben. Egy mondat maga utn vonz egy msik mondatot, ha igaz minden vilgban, ahol igaz.
Ezzel ekvivalens defincik az mondat rvnyessgt (validity) s a mondat
kielgthetetlensgt (unsatisfiability) meghatroz defincik.
A kvetkeztets az a folyamat, amivel j mondatok vezethetk le rgiekbl. A helyes (sound) kvetkeztetsi
algoritmusok csak vonzat mondatokat vezetnek le; a teljes (complete) algoritmus az sszes kvetkezmnyt
levezeti.
Az tletkalkulus (propositional logic) egy nagyon egyszer nyelv, amely tlet-szimblumokbl
(proposition symbols) s logikai sszektjelekbl (logical connectives) ll. Kpes kezelni olyan
lltsokat, amelyekrl tudjuk, hogy igazak, tudjuk, hogy hamisak, vagy teljesen ismeretlen az
igazsgrtkk.
Ha adott egy tletkalkulus szimblumsztr, akkor a lehetsges modellek szma vges, gy a vonzatok
ellenrzse trtnhet a modellek felsorolsval is. Hatkony tletkalkulus modellellenrz (model
checking) algoritmusok tbbek kztt viszszalpses vagy loklis keressi eljrsokat alkalmaznak,
amelyekkel gyakran nagymret problmkat is nagyon gyorsan meg tudnak oldani.
A kvetkeztetsi szablyok (inference rules) helyes kvetkeztetsi mintk, amelyeket felhasznlhatunk
bizonytsok megtallshoz. A rezolci (resolution) szably teljes kvetkeztetsi algoritmust biztost olyan
tudsbzisokhoz, amelyek konjunktv norml formban (conjunctive normal form) vannak kifejezve. Az
elrefel lncols (forward chaining) s a htrafel lncols (backward chaining) igen termszetes
rvelsi algoritmusok Horn-formban (Horn form) adott tudsbzisokon.
Ktfajta genst lehet pteni az tletkalkulus alkalmazsra: a kvetkeztetsalap gens (inference-based
agent) kvetkeztetsi algoritmusokat hasznl a vilg esemnyeinek kvetsre, s kpes rejtett jellemzket is
levezetni, mg az ramkrn alapul gens (circuit-based agent) az lltsokat regiszterek bitjeiknt
reprezentlja, s jelek logikai ramkrkben trtn terjesztsvel vgzi ezek frisstst.
Az tletkalkulus meglehetsen hatkony bizonyos feladatokra egy gensben alkalmazva, de kezelhetetlen
nemkorltos mret krnyezetekben, mivel hinyzik a megfelel kifejez er az id, a tr s az objektumok
kztti kapcsolatok ltalnos mintinak lersra.
Logikai gensek
mdszere az, ha a szksges ismereteket kzljk az genssel. Allen Newell cikke (1982) a The Knowledge
Level trgyalja azt a megkzeltst, hogy racionlis gensek lerhatk s elemezhetk egy absztrakt szinten,
ami az ltaluk birtokolt tudst s nem azt a programot definilja, amit futtatnak. A mestersges intelligencia
deklaratv s procedurlis megkzeltseit hasonltja ssze Boden (Boden, 1977). A vitt, msok mellett Brooks
(Brooks, 1991) s Nilsson (Nilsson, 1991) rsai lesztettk fel jra.
Magnak a logiknak az eredete az si grg filozfiban s matematikban tallhat. Szmos logikai alapelv
a mondatok szintaktikus struktrjnak sszektse az igaz vagy hamis jellegkkel, a jelentskkel, a bennk
megjelen argumentumok rvnyessgvel elszrt helyeken megtallhat Platn mveiben. Arisztotelsz
ksztette az els ismert, rendszerezett munkt a logikrl. Munkjt dikjai gyjtttk ssze halla utn, i. e.
322-ben az Organon c. tanulmnyban. Arisztotelsz szillogizmusai (syllogisms) olyan logikai lltsok voltak,
amelyeket ma kvetkeztetsi szablyoknak neveznnk. Habr a szillogizmus tartalmazott elemeket, mind a
propozcis, mind az elsrend logikbl, a rendszer, mint egsz, igen gyengnek szmt a modern kvnalmak
szerint. Nem tette lehetv tetszleges komplexits mondatok ltrehozst a kvetkeztetsi mintkban, mint a
modern tletlogika.
A hasonl Megara s sztoikus iskolk (az i. e. 5. szzadban indultak, s tbb szz ven keresztl mkdtek)
vezettk be az implikcit s ms alapvet szerkezeteket, amelyeket ma is hasznlunk a modern tletlogikban.
Logikai sszektjelek definilsra vezette be az igazsgtbla hasznlatt Philn s Megara. A sztoikusok t
alapvet kvetkeztetsi szablyt hasznltak, amelyeket igazols nlkl rvnyesnek tartottak, kztk azt a
szablyt, amelyet ma Modus Ponensnek nevezznk. Szmos szablyt vezettek le ebbl az tbl, felhasznlva
tbbek kztt a dedukci elmletnek alapelvt 4. szakasz - Az tletkalkulus kvetkeztetsi minti rszben, s
sokkal tisztbban hasznltk a bizonyts fogalmt, mint azt Arisztotelsz tette. A sztoikusok azt lltottk, hogy
az logikjuk teljes abban az rtelemben, hogy tartalmaz minden rvnyes kvetkeztetst, de ami fennmaradt
munkjukbl, az tlsgosan tredkes ahhoz, hogy elemezhet legyen. A Megara s a sztoikus logikk
trtnetnek, mr amennyire ezek ismertek, j beszmoljt ksztette el Benson Mates (Mates, 1953).
Wilhelm Leibniztl (16461716) szrmazik a mestersges formlis nyelvi mintk ltrehozsnak tlete a logikai
kapcsolatok tisztzsnak s a logikai kvetkeztets egy tisztn formlis s mechanikus folyamatt val
egyszerstse cljbl. Leibniz sajt matematikai logikja azonban igencsak tkletlen volt, s r inkbb
ezeknek a gondolatoknak mint clkitzseknek a bevezetsrt s nem e clok megvalstsra tett ksrletei
miatt emlkeznk.
George Boole vezette be els igazn tfog s mkdkpes formlis logikai alap rendszert a The
Mathematical Analysis of Logic c. knyvben (Boole, 1847). Boole logikjnak modellje kzel llt a vals
szmok algebrjhoz, s elsdleges kvetkeztetsi mdszerknt a logikailag ekvivalens mondatok
helyettestst hasznlta. Br Boole rendszere csak tredke volt a teljes tletkalkulusnak, elg kzel volt
ahhoz, hogy a 19. szzad szerzi Boole-t kvetve hamar kitltsk a hinyz rszeket. Schrder definilta
(Schrder, 1877) a konjunktv norml formt, mg a Horn-formt sokkal ksbb Alfred Horn (Horn, 1951)
vezette be. A modern tletkalkulus (s elsrend logika) els tfog bemutatsa Gottlob Frege Begriffschrift
(Az rs fogalma vagy Fogalmi jells) c. knyvben (Frege, 1879) tallhat.
Az els mechanikai eszkzt, amely logikai kvetkeztetst vgzett, Stanhope harmadik grfja (17531816)
ksztette. A Stanhope Demonstrator kpes volt szillogizmusokat kezelni s bizonyos valsznsgi
kvetkeztetseket vgezni. Wiliam Stanley Jevons egyike azoknak, akik tovbbfejlesztettk s kiegsztettk
Boole munkjt 1869-ben a Boole-logikn alapul kvetkeztetsek vgrehajtsra megptette a logical
pian-jt. Ezeknek s ms korai kvetkeztetsre ksztett mechanikus eszkzknek szrakoztat s tanulsgos
trtnete Martin Gardner (Gardner, 1968) munkjban olvashat. Az els logikai kvetkeztetst vgz, publiklt
szmtgpes program a Logic Theorist volt, amelyet Newell, Shaw s Simon (Newell, Shaw s Simon, 1957)
ksztettek. Ezt a programot az emberi gondolkods modellezsre szntk a szerzk. Br Martin Davis (Davis,
1957) tervezett egy programot, ami bizonythatan 1954-ben kszlt, de a Logic Theorist eredmnyeit korbban
publikltk. Mind Davis 1954-es programja, mind a Logic Theorist rszben ad hoc mdszerekre plt, amelyek
nem voltak jelents hatssal a ksbbi automatikus dedukcis rendszerekre.
Az igazsgtblknak, mint az tletkalkulus nyelvben az rvnyessgnek vagy a mondat
kielgthetetlensgnek a tesztjt egymstl fggetlenl Ludwig Wittgenstein (1922) s Emil Post (1921)
vezettk be. A harmincas vekben jelents haladst rtek el az elsrend logika kvetkeztetsi mdszereinek
tern. Nevezetesen, Gdel megmutatta (Gdel, 1930), hogy az elsrend logikban trtn kvetkeztetsre egy
teljes eljrst lehet kapni az tletlogikra trtn redukcival, felhasznlva Herbrand elmlett (Herbrand,
1930). A 9. fejezetben jra ttekintjk ennek trtnett, itt most a lnyeges pont az, hogy a hatvanas vekben, a
hatkony tletkalkulus algoritmusok fejlesztsben a matematikusok rdekldst jelents mrtkben motivlta
210
Created by XMLmind XSL-FO Converter.
Logikai gensek
Logikai gensek
tmval. Brooks amellett rvelt (Brooks, 1991), hogy az ramkralap gensen kvl ms nem is szksges a
mestersges intelligencihoz mivel ms mdszerek nehzkesek, drgk s szksgtelenek. A mi nzetnk
szerint, egyik mdszer sem elgsges nmagban.
A wumpus vilgot Gregory Yob (Yob, 1975) tallta ki. Nmi irnival, Yob azrt fejlesztette ki, mert unta
azokat a jtkokat, amelyeket egy rcson jtszanak: az eredeti wumpus vilg dodekader alak volt, mi
helyeztk vissza a rgi unalmas ngyzetrcsba. Michael Genesereth javasolta elszr, hogy a wumpus vilgot az
gensek tesztkrnyezeteknt alkalmazzuk.
7.2. Feladatok
7.1.
rja le a wumpus vilgot a 2. fejezetben felsorolt feladatkrnyezetek tulajdonsgainak felhasznlsval.
7.2.
Tegyk fel, hogy az gens eljutott a 7.4. (a) bra szerinti llapotba, gy, hogy nem rzett semmit az [1, 1]-ben,
szellt rzett az [2, 1]-ben s bzt az [1, 2]-ben, s most vizsglja az [1, 3], [2, 2] s [3, 1] ngyzetek tartalmt.
Ezek brmelyike tartalmazhat csapdt, s legfeljebb az egyik tartalmazhatja a wumpust. A 7.5. bra pldjt
kvetve hozza ltre a lehetsges vilgokat (32 ilyet kell tallnia). Jellje meg azokat a vilgokat, amelyekben a
TB igaz, s azokat, amelyekben a kvetkez mondatok igazak:
2 = Nincsen csapda a [2, 2]-ben
3 = Az [1,3]-ban wumpus van
Logikai gensek
7.5.
Vegynk egy sztrat, amelyben csak ngy tletkalkulus llts ltezik, az A, B, C s D. Hny modellje ltezik a
kvetkez mondatoknak?
a. (A B) ( B C )
b. A B
c. A B C
7.6.
Definiltunk 4 binris logikai sszektjelet.
a. Lteznek-e mg tovbbiak, amelyek hasznosak lehetnek?
b. Hny binris sszektjel lehetsges?
c. Mirt nem tlsgosan hasznos kzlk nhny?
7.7.
Egy szabadon vlasztott mdszer felhasznlsval igazolja a 7.11. bra ekvivalenciit.
7.8.
Vizsglja meg a kvetkez mondatokat, s dntse el mindegyikre, hogy rvnyesek, kielgthetetlenek, vagy
egyik sem. Igazolja a dntst igazsgtblval, vagy felhasznlva a 7.11. bra ekvivalencia szablyait. Van-e
olyan, amit elsre eltvesztett?
a. Fst Fst
b. Fst Tz
c. (Fst Tz) (Fst Tz)
d. Fst Tz Tz
e. ((Fst Hsg) Tz) ((Fst Tz) (Hsg Tz))
f. (Fst Tz) ((Fst Hsg) Tz)
g. Nagy Hallgatag (Nagy Hallgatag)
h. (Nagy Hallgatag) Hallgatag
7.9.
(Barwise s Etchemendy, 1993 alapjn) Be tudja-e bizonytani, hogy az unikornis mitikus, ha adottak az
albbiak? Mit mondhatunk a mgikussgrl? Van-e szarva?
Ha az unikornis mitikus, akkor halhatatlan, de ha nem halhatatlan, akkor egy haland emls. Ha az unikornis
vagy halhatatlan, vagy emls, akkor van szarva. Az unikornis mgikus llat, ha van szarva.
7.10.
Minden logikai mondat logikailag ekvivalens azzal az lltssal, hogy minden lehetsges vilg, amelyben hamis
volna, nem az eset. Felhasznlva ezt a megfigyelst, bizonytsa be, hogy minden mondat trhat konjuglt
normlt formra.
7.11.
213
Created by XMLmind XSL-FO Converter.
Logikai gensek
Az ismert szmtgpes jtk, az Aknakeres igen hasonl a wumpus vilghoz. Az aknakeres vilg egy N
ngyzetet tartalmaz ngyzetes rcs, amelyek kzl M elszrtan elhelyezked ngyzet lthatatlan aknt takar.
Minden ngyzetet megprblhat az gens, de azonnali halllal lakol, ha ott egy aknt tall. Az Aknakeres jtk
minden kiprblt ngyzetben felfedi, hogy hny kzvetlenl vagy tlsan szomszdos ngyzetben van akna,
ezzel mutatva az aknk jelenltt. A cl az, hogy minden aknt nem tartalmaz ngyzetet megprbljunk.
a. Legyen Xi,j igaz akkor s csakis akkor, ha az [i, j] tartalmaz egy aknt. rja le az Xi,j szimblum logikai
kombincijt tartalmaz mondattal azt a kijelentst, hogy pontosan kt akna szomszdos az [1,
1]gyel.
b. ltalnostsa az (a)-beli kijelentst megmutatva, hogy hogyan hozhat ltre konjuglt norml formj
mondat annak kifejezsre, hogy az n szomszdos ngyzetbl k ngyzet tartalmaz aknt.
c. Magyarzza meg pontosan, hogy hogyan hasznlhat egy gens DPLL algoritmust annak bizonytsra, hogy
egy adott ngyzet tartalmaz (vagy nem tartalmaz) aknt, figyelmen kvl hagyva azt a globlis korltot, hogy
pontosan M akna van sszesen.
d. Tegyk fel, hogy a globlis korlt a (b) feladatrszben megfogalmazott mdon van ltrehozva. Hogyan fgg
a klzok szma M-tl s N-tl? Javasoljon egy mdostst a DPLL algoritmushoz, amellyel a globlis
korltot nem kell explicit mdon reprezentlni.
e. Van-e olyan a (c) feladatrszben definilt eljrs ltal ellltott kvetkezmny, amely rvnytelenn vlna,
ha figyelembe vennnk a globlis knyszert?
f. Mutasson pldt olyan lehetsges konfigurcikra, amelyek tvoli fggsgeket idznek el, olyanokat, ahol
egy ki nem prblt ngyzet tartalma tvoli ngyzetek tartalmrl ad informcit. [Segtsg: vizsgljon meg
egy N 1-es tblt.]
7.12.
Ez a feladat a klzok s az implikcis mondatok kztti kapcsolatot vizsglja.
a. Mutassa meg, hogy a (P1 Pm Q) klz logikailag ekvivalens a (P1 Pm Q) implikcis
mondattal.
b. Mutassa meg, minden klz (fggetlenl a pozitv literlok szmtl) felrhat (P1 Pm) (Q1
Qm) alakban, ahol P-k s Q-k tletkalkulus szimblumok. Az ilyen mondatokat tartalmaz tudsbzist
implikatv norml formjnak (implicative normal form) vagy Kowalski formjnak (Kowalski form)
nevezzk.
c. rja le a teljes rezolcis szablyt implikatv norml formj mondatokra.
7.13.
Ebben a feladatban tervezze tovbb az ramkrn alapul wumpus genst.
a. rjon egy a (7.4) egyenlethez hasonl egyenletet a Nyl kijelentshez, amelynek igaznak kell lennie, amikor
az gensnek mg van nyla.
b. Ismtelje meg az (a) feladatot egy ArccalJobbra kijelentsre, ahol hasznlja fel a (7.5) egyenletet modellknt.
c. Ksztsen vltozatokat a (7.7) s (7.8) egyenletekre a wumpus megtallshoz, s rajzolja fel az ramkrt.
7.14.
Elemezze, hogy mit is jelent az optimlis viselkeds a wumpus vilgban! Mutassa meg, hogy az IT-WUMPUSGENS defincija nem optimlis, s tegyen javaslatot a fejlesztsre!
7.15.
Bvtse ki az IT-WUMPUS-GENS-t gy, hogy kpes legyen folyamatosan kvetni a relevns tnyeket a
tudsbzisban!
214
Created by XMLmind XSL-FO Converter.
Logikai gensek
7.16.
Mennyi ideig tart a DPLL szmra a bizonytsa, ahol egy literlis, amelyet mr tartalmaz a TB? Adjon
magyarzatot!
7.17.
Kvesse a DPLL viselkedst a 7.15. brn lert tudsbzison, amikor Q-t prbljuk meg bizonytani, s
hasonltsa ssze ezt a mkdst az elrefel lncolsi algoritmussal.
215
Created by XMLmind XSL-FO Converter.
1. Mg egyszer a reprezentcirl
Ebben az alfejezetben a reprezentcis nyelvek termszett vizsgljuk. Megllaptsaink be fogjk mutatni az
elsrend logika fejlesztsnek szksgessgt, ami egy lnyegesen nagyobb kifejezervel rendelkez nyelv,
mint a 7. fejezetben bemutatott tletkalkulus. Megnzzk majd, hogy az tletkalkulus s msfajta nyelvek mire
kpesek, s mire nem. A krdst itt csak felletesen trgyaljuk, nhny bekezdsbe srtve vszzadok
gondolatait, ksrletezseit s kudarcait.
A programnyelvek mint pldul a C++, a Java vagy a Lisp a hasznlatban lv formlis nyelvek messze
legnagyobb csoportjt alkotjk. A programok nmagukban, sz szerinti rtelemben, csak szmtsi folyamatokat
reprezentlnak. A programokon belli adatstruktrk tnyeket reprezentlhatnak; pldul egy program
hasznlhatja a 4 4-es ngyzetrcs-elrendezst a wumpus vilg elemeinek reprezentlshoz. gy teht az a
programnyelvi llts, hogy Vilg[2, 2] Csapda viszonylag termszetes mdja annak a kijelentsnek, hogy
van egy csapda a [2, 2] ngyzetben. (Az ilyesfajta reprezentcikat ad hoc jellegnek vlhetjk; az
adatbzisrendszereket pontosan azrt fejlesztettk ki, hogy ltalnosabb, trgyterlet-fggetlen mdjt
biztostsk a tnyek trolsnak s visszakeressnek.) A programnyelvek hinyossga, hogy nem rendelkeznek
ltalnos mechanizmussal arra, hogy tnyeket ms tnyekbl levezessenek; az adatstruktra minden frisstse
egy trgyterlet-specifikus eljrs segtsgvel trtnik, amelynek rszleteit a programoz vezeti le a
trgyterletrl meglv ismereti alapjn. Ez a procedurlis (procedural) megkzelts szembellthat az
tletkalkulus deklaratv (declarative) termszetvel, amelyben a tuds s az interferencia klnll fogalmak,
a kvetkeztets pedig teljes mrtkben trgyterletfggetlen.
A programok adatstruktrinak (s gy az adatbzisoknak is) a msik htrnya annak a kpessgnek a hinya,
hogy egyszeren lehessen kijelenteni pldul azt, hogy Van egy lyuk a [2, 2]-ben vagy a [3, 1]-ben, vagy azt,
hogy Ha a wumpus az [1, 1]-ben van, akkor nincs a [2, 2]-ben. A programok egyetlen rtket tudnak trolni
minden vltozhoz, nhny rendszer lehetv teszi azt is, hogy az rtk ismeretlen legyen, de hinyzik
bellk a rszinformcik kezelshez szksges kifejezer.
Az tletkalkulus egy deklaratv nyelv, mivel szemantikja mondatok s a lehetsges vilgok kztti
igazsgrelcikon alapul. Elgsges a kifejezereje ahhoz is, hogy rszinformcikat kezeljen, diszjunkcik
vagy negcik hasznlatval. Az tletkalkulusnak ezeken kvl egy harmadik tulajdonsga is van, ami
kvnatos a reprezentcis nyelvek esetben, nevezetesen a kompozcis kpessg (compositionality). Egy
kompozcis nyelvnl a mondat jelentse a mondatrszek jelentsnek a fggvnye. Pldul, a B1,4 B1,2
kapcsolatban van a B1,4 s a B1,2 jelentsvel. Nagyon furcsa lenne, ha a B1,4 azt jelenten, hogy az [1, 4]-es
ngyzet bds, s a B1,2 azt jelenten, hogy az [1, 2]-es ngyzet bds, de a B1,4 B1,2 mr azt jelenten,
hogy Franciaorszg s Lengyelorszg dntetlent jtszott a mlt heti jgkorong-selejtez mrkzsen.
Egyrtelm teht, hogy a kompozcis kpessg hinya nagyban megnehezti a kvetkeztet rendszerek
mkdst.
Elsrend prediktumkalkulusnak (first-order predicate calculus) is szoktk nevezni, s nha ERPK-nak rvidtik.
216
Created by XMLmind XSL-FO Converter.
Elsrend logika
Mint azt a 7. fejezetben lttuk, az tletkalkulusnak nincs elgsges kifejezereje egy sok objektumos krnyezet
tmr lershoz. Pldul knytelenek voltunk minden egyes ngyzetnl nll szablyt rni a csapdkra s a
szellkre:
S1,1 (C1,2 C2,1)
Magyarul, ezzel szemben, elgg egyszernek tnik egyszer s mindenkorra kijelenteni, hogy A lyukas
ngyzetek mellett lvk szellsek. A termszetes nyelvek szintaxisa s szemantikja lehetv teszik a
krnyezet tmr s sszefogott lerst.
Els ltsra gy tnik, hogy a termszetes nyelvek (mint az angol vagy a magyar) valban nagyon kifejezk.
Kpesek voltunk csaknem a teljes knyvet termszetes nyelven megrni, s csak alkalmanknt kellett ttrnnk
ms nyelvekre (belertve a logikt, a matematikt s a diagramok nyelvt). Nagy mlt hagyomny a
nyelvszetben s a nyelvek filozfijban, hogy a termszetes nyelvet elssorban deklaratv tudsreprezentcis
nyelvnek tekintjk, s megprbljuk rgzteni ennek formlis szemantikjt. Ha egy ilyen kutats sikeres lenne,
nagy elrelpst jelenthetne a mestersges intelligencia szmra, mert egy termszetes nyelvet (vagy annak
valamilyen szrmazkt) hasznlhatnnk a tudsreprezentcihoz vagy a kvetkeztet rendszerekben.
A modern megkzelts szerint a termszetes nyelv kiss ms clt szolgl, nevezetesen a nyelv a
kommunikci (communication), s nem annyira a tiszta reprezentci eszkze. Amikor egy beszl rmutat
valamire, s azt mondja: Nzd! a hallgat megtudja azt, hogy mondjuk, Superman vgre megjelent a hztetk
felett. Mgsem szeretnnk azt kijelenteni, hogy a Nzd! mondatban benne foglaltatik ez a tny is. A mondat
jelentse mind magtl a mondattl, mind attl a szvegkrnyezettl (context) fgg, amelyben a mondat
elhangzott. Nyilvnvalan nem vrhat, hogy csupn a Nzd! mondatot az adatbzisban trolva visszaadhat
ennek a jelentse a szvegkrnyezet ismerete nlkl amibl az a krds kvetkezik, hogy hogyan tudjuk
magt a szvegkrnyezetet reprezentlni. A termszetes nyelvekbl is hinyzik a kompozcis kpessg egy
olyan mondat jelentse, mint az s akkor megltta, fgghet az eltte ll s az utna kvetkez mondatok
ltal alkotott szvegkrnyezettl. Vgl pedig a termszetes nyelvek egyik gyenge pontja a tbbrtelmsg
(ambiguity), ami nehzsgeket okozhatna a kvetkeztetsben. Amint azt Pinker megllaptja (Pinker, 1995):
Mikor az emberek az gre gondolnak, bizonyra nem zavarja meg ket, hogy vajon az gboltrl van-e sz,
vagy valamirl, ami lngol s ha egy sz kt gondolatot is megjelenthet, akkor a gondolatok nem feleltethetk
meg szavaknak.
Azt a megkzeltst kvetjk, hogy ptnk az tletkalkulus alapjaira felhasznlva, hogy ez egy deklaratv,
kompozcis szemantika, ami fggetlen a szvegkrnyezettl, s egyrtelm. Majd ezekre az alapokra egy mg
kifejezbb logikt ptnk azltal, hogy felhasznlunk a termszetes nyelveknl alkalmazott reprezentcis
megoldsokat, mikzben igyeksznk elkerlni ennek a htrnyait. A termszetes nyelv szintaxist vizsglva a
legegyszerbben azonosthat sszetevk a fnevek s a fnvi kifejezsek, amelyek objektumokra (objects)
utalnak (ngyzetek, lyukak, wumpusok), valamint az igk s az igei kifejezs, amelyek az objektumok kztt
fennll relcikra (relations) utalnak (szells, szomszdos, kil). Ezeknek a relciknak egy rsze fggvny
(function) azaz olyan relcik, amelyeknek csak egyetlen rtkk van egy adott bemenethez. Knnyen
tallhatunk pldkat objektumokra, relcikra s fggvnyekre:
Objektumok: emberek, hzak, szmok, elmletek, Ronald McDonald, sznek, baseballmeccs, hbork,
vszzadok
Relcik: lehetnek unris relcik vagy tulajdonsgok (properties), gymint piros, kerek, sznlelt,
elsrend, tbbemeletes, vagy ltalnosabb n-elem relcik, gymint testvre, nagyobb, belsejben, rsze,
szne, utna trtnt, birtokol, kett kztt van
Fggvnyek: apja, legjobb bartja, harmadik hivatali ideje, eggyel tbb mint, kezdete
Valjban minden llts elkpzelhet gy, mint ami objektumokra, relcikra s fggvnyekre vonatkozik. me
nhny plda:
Egy plusz kett egyenl hrommal.
Objektumok: egy, kett, hrom, egy meg kett; Relci: egyenl; Fggvny: plusz. (Egy plusz kett a neve
annak az objektumnak, amelyet gy kapunk, hogy a plusz fggvnyt alkalmazzuk az egy s kett
objektumokra. A hrom egy msik neve ugyanennek az objektumnak.)
A wumpus helyvel szomszdos ngyzetek bdsek.
217
Created by XMLmind XSL-FO Converter.
Elsrend logika
218
Created by XMLmind XSL-FO Converter.
Elsrend logika
Az tletlogika felttelezi pldul, hogy a definilt tnyek fennllnak vagy nem llnak fenn a vilgban. Minden
tnynek kt llapota lehet: igaz vagy hamis.2 Az elsrend logika bonyolultabb felttelezsekre pt,
nevezetesen, hogy a vilg objektumokbl pl fel, amelyek kztt relcik lteznek, amelyek vagy fennllnak,
vagy nem. A specilis cl logikk tovbbi ontolgiai hozzrendelseket tesznek; pldul a temporlis logika
(temporal logic) felttelezi, hogy a tnyek csak bizonyos idben llnak fenn, s hogy ezek az idk amelyek
lehetnek idpontok s idtartamok is rendezhetk. gy ezek a specilis cl logikk az objektumok egy
bizonyos fajtjhoz (s az azokhoz tartoz aximkhoz) els osztly sttust rendelnek a logikn bell,
ahelyett hogy egyszeren meghatroznk ket a tudsbzison bell. A magasabb rend logika (higher-order
logic) gy tekint az elsrend logikban relciknak s fggvnyeknek nevezettekre, mintha azok maguk is
objektumok lennnek. Ez lehetv teszi, hogy minden relcirl lltsokat alkossunk pldul arra, ha valaki
azt szeretn meghatrozni, mit jelent, hogy egy relci tranzitv. Eltren ms specilis cl logikktl a
magasabb rend logika egyrtelmen nagyobb kifejezervel rendelkezik, mint az elsrend logika, abban az
rtelemben, hogy nhny magasabb rend logikai llts nem rhat le vges szm elsrend logikai lltssal.
Egy logika jellemezhet mg az ismeretelmleti megllaptsaival (epistemological commitments) is az
egyes tnyekhez megengedett tudsllapotokkal. Mind az tletkalkulusban, mind az elsrend logikban egy
llts egy tnyt reprezentl, s az gens vagy elhiszi, hogy az llts igaz, vagy hamisnak vli, vagy nincs rla
vlemnye. Ezekben a logikkban teht a tudsnak hrom lehetsges llapota van, brmely lltst is tekintjk.
Ezzel szemben azok a rendszerek, amelyek a valsznsg-elmletet (probability theory) hasznljk,
tartalmazhatnak egy hiedelemfokozatot, ami a 0-tl (teljes hitetlensg) az 1-ig tart (teljes elfogads).3 Pldul,
egy valsznsthet wumpusvilgbeli gens hiheti, hogy a wumpus az [1, 3]-ban van, 0,75-s valsznsggel.
Az t klnbz logikai rendszer ontolgiai s ismeretelmleti megllaptsait a 8.1. tblzatban foglaltuk
ssze.
nyelvek,
valamint
azok
ontolgiai
ismeretelmleti
A kvetkez alfejezetben elkezdjk az elsrend logika rszletes trgyalst. Ahogy egy fizikt tanul diknak
valamilyen szinten rendelkeznie kell matematikai ismeretekkel, a mestersges intelligencit tanulmnyozknak
is el kell sajttaniuk bizonyos jrtassgot a logikai jellsi rendszerek hasznlatban. Msrszt az is nagyon
fontos, hogy ne bonyoldjunk bele a logikai jellsi rendszerek sajtossgaiba hiszen szmos klnbz
vltozat ltezik. A lnyeges az, hogy tudatban legynk annak, hogy a nyelv miknt knnyti meg tmr
reprezentcik ltrehozst, s hogy a szemantika miknt vezet el helyes kvetkeztetsi folyamatokhoz.
219
Created by XMLmind XSL-FO Converter.
Elsrend logika
igazsgrtkeinek halmazai. Az elsrend logika modelljei ennl rdekesebbek. Elszr is, ezek tartalmaznak
objektumokat! A modell trgyterlete (domain) azoknak az objektumoknak a halmaza, amelyeket a
trgyterlet tartalmaz; ezeket az objektumokat szoktuk a trgyterlet elemeinek (domain elements) nevezni. A
8.2.
bra bemutat egy modellt t objektummal:
Oroszlnszv Richrd, Anglia kirlya 1189-tl 1199-ig; ccse, gonosz Jnos kirly, aki 1199-tl 1215-ig
uralkodott; Richrd s Jnos bal lba; vgl egy korona.
A modellben tallhat objektumok tbbfle relciban lehetnek egymssal. A 8.2. brn Richrd s Jnos
testvrek. Formlisan, egy relci csak egymssal kapcsolatban lv objektumok n-eseinek (tuple) halmaza.
(Egy n-es az objektumok egy rgztett sorrendben felsorolt gyjtemnye, amely objektumokat a zrjelpr
vesz krbe.) gy teht ebben a modellben a testvrrelci a kvetkez halmaz:
{ Oroszlnszv Richrd, Jnos kirly , Jnos kirly, Oroszlnszv Richrd }(8.1)
(Itt magyarul neveztk meg az objektumokat, de kpzeletben be lehetne helyettesteni a neveket pldul
kpekkel is.) A korona Jnos kirly fejn van, teht a fejn relcihoz csak egy n-es tartozik a korona, Jnos
kirly .
A testvr s a fejn relcik binris relcik ez azt jelenti, hogy kt objektum kztt lltanak fel
kapcsolatot. A modell ezenkvl egyelem, unris relcikat vagy tulajdonsgokat is tartalmaz: A szemly
tulajdonsg egyarnt igaz Richrdra s Jnosra; a kirly tulajdonsg csak Jnosra igaz (felteheten azrt, mert
Richrd ekkor mr halott volt); mg a korona tulajdonsg csak a koronra igaz.
8.2. bra - Egy t objektumot kt binris relcit, hrom egyelem relcit (cmkkkel
jelezve az objektumokon) s egy egyargumentum fggvnyt, bal lb tartalmaz
modell
A kapcsolatok egyes tpusai leginkbb fggvnyeknek tekinthetk, ahol egy adott objektumnak pontosan csak
egy msik objektummal kell ilyen kapcsolatban lennie. Pldul minden egyes szemlynek egy bal lba van,
teht a modellben tallhat egy bal lb fggvny, ami a kvetkez lekpezseket teszi lehetv:
Oroszlnszv Richrd Richrd bal lba
220
Created by XMLmind XSL-FO Converter.
Elsrend logika
Jnos kirly Jnos bal lba (8.2)
Pontosabban megfogalmazva, az elsrend logika modelljei totlis fggvnyeket (total functions) kvnnak
meg, ami azt jelenti, hogy minden bemeneti n-eshez tartoznia kell egy rtknek. gy teht a koronhoz tartoznia
kell egy bal lbnak, s ennek gy kell lennie minden bal lb esetben. Ltezik erre a problmra egy technikai
megolds, amely egy hozzadott lthatatlan objektumot vezet be: egy bal lbat rendel mindenhez, amelynek
nincs bal lba, belertve nmagt is. Szerencsre, amg valaki nem tesz kijelentseket a bal lbakrl vagy olyan
dolgokrl, amelyeknek nincs bal lbuk, ezeknek a technikai problmknak nincs jelentsgk.
8.3. bra - Az elsrend logika (egyenlsggel kiegsztett) szintaxisa BackusNaurforma jellseivel. (Lsd az 1. szakasz - B1. Nyelvek definilsa BackusNaurFormban (BNF) rszben, ha ez a jells ismeretlen.) A szintaxis szigor a zrjelezs
tekintetben; a zrjelekrl s az opertori elsbbsgrl a 3.1. szakasz - Szintaxis
rszben szerepl megjegyzsek ugyangy vonatkoznak az elsrend logikra is.
A szemantika a mondatokat a modellekhez kapcsolja, s kpesnek kell lennie az igazsg meghatrozsra. Hogy
ez megtrtnjen, szksgnk van egy interpretcira, amely pontosan megjelli, hogy mely objektumok,
relcik s fggvnyek felelnek meg a konstans-, prediktum- s fggvnyszimblumoknak. Egy lehetsges
interpretci amit szndkolt interpretcinak (intended interpretation) neveznk a mi esetnkben a
kvetkez:
Richrd Oroszlnszv Richrdra, mg Jnos a gonosz Jnos kirlyra vonatkozik.
221
Created by XMLmind XSL-FO Converter.
Elsrend logika
A Testvr a testvri kapcsolatra vonatkozik, ami a (8.1) egyenletben megadott n-es halmazban lthat; a
Fejn arra a fejn relcira vonatkozik, ami a korona s Jnos kirly kztt ll fenn; a Szemly, Kirly s
Korona pedig arra az objektumhalmazra vonatkoznak, amelyek szemlyek, kirlyok s koronk.
A BalLb azt a bal lb fggvnyt jelenti, aminek a lekpezst a (8.2) egyenletben adtuk meg.
Sok ms lehetsges interpretci is ltezik, ami ezeknek a szimblumoknak a modellhez val kapcsolatt rja le.
Pldul egy lehetsges interpretciban Richrd jelenti a koront s Jnos a Jnos kirly bal lbt. A modell t
objektumot tartalmaz, gy 25 lehetsges interpretci adhat meg csak a Richrd s a Jnos
konstansszimblumokhoz.
Figyeljk meg, hogy nem minden objektumnak van arra szksge, hogy elnevezzk pldul a szndkolt
interpretci nem nevezi meg a koront vagy a lbakat. Az is lehetsges, hogy egy objektumnak tbb neve
legyen; ltezik olyan interpretci, amelyben a Richrd s a Jnos is a koronra vonatkozik. Ha ez a lehetsg
zavar, emlkezznk arra, hogy az tletlogikban teljessggel elfogadhat egy olyan modell, amelyben a
Felhs s a Napos egyarnt igaz. A tudsbzis feladata az, hogy kizrja azokat a modelleket, amelyek
ellentmondsban vannak ismereteinkkel.
Brmely mondat igazsgt egy modell s a mondat szimblumainak az interpretcija hatrozza meg. gy teht
a vonzat, az rvnyessg s ms jellemzk az sszes lehetsges modell s az sszes lehetsges interpretci
termjeinek felhasznlsval vannak meghatrozva. Fontos megjegyezni, hogy a trgyterlet elemek szma
minden egyes modellben korltlan lehet a trgyterlet elemei pldul lehetnek egsz vagy vals szmok.
Ebbl kvetkezen, a lehetsges modellek szma korltlan, mint ahogy az interpretcik szma is. A maga utn
vonzsnak az sszes lehetsges modell felsorolsval trtn vizsglata, ami az tletlogikban mkdik, nem
lehetsges az elsrend logikban. Mg ha az objektumok szma korltos is, a kombincik szma nagyon nagy
lehet. A pldnkban szerepl objektumokkal hozzvetlegesen 1025 a kombincik szma, egy t objektummal
rendelkez trgyterletben (lsd 8.5. feladat).
2.3. Termek
Egy term (term) egy objektumra vonatkoz logikai kifejezs. A konstansszimblumok teht termek, de nem
mindig knyelmes nll szimblumot alkalmazni minden egyes objektum megnevezsnl. Magyarul inkbb a
Jnos kirly bal lba kifejezst hasznljuk, mintsem nevet adjunk a lbnak. Ezrt hasznlunk
fggvnyszimblumokat: a konstansszimblumok hasznlata helyett inkbb a BalLb(Jnos)-t alkalmazzuk.
ltalnos esetben egy sszetett term egy fggvnyszimblumbl ll, amelyet a fggvnyszimblum
argumentumainak zrjelezett listja kvet. Fontos megjegyezni, hogy egy sszetett term nem ms, mint egy
bonyolult formj nv, s nem egy rtket visszaad szubrutin hvs. Nem egy BalLb szubrutinrl van sz,
amely bemenetknt megkap egy szemlyt, s visszaad egy lbat. Tudunk kvetkeztetni a bal lbakkal
kapcsolatban (pl. kiindulva az ltalnos szablybl, hogy mindenkinek van egy bal lba, s ebbl levezethet,
hogy Jnosnak is lennie kell) anlkl, hogy valaha is megadnnk a BalLb defincijt. Ez is olyasmi, amit nem
tehetnk meg a programozsi nyelvek szubrutinjaival.4
A termek formlis szemantikja nyilvnval. Tekintsk az f(t1, , tn) termet. Az f fggvnyszimblum a
modellben tallhat valamely fggvnyre (nevezzk F-nek) vonatkozik; az argumentum termek a
trgyterletben fellelhet objektumokra vonatkoznak (nevezzk ket d1, , dn-nek); s a term egszben arra az
objektumra vonatkozik, ami a d1, , dn-re alkalmazott F fggvny rtke. Pldul ttelezzk fel, hogy ha a
BalLb fggvnyszimblum a (8.2) egyenletben mutatott fggvnyre vonatkozik, s a Jnos vonatkozik Jnos
kirlyra, akkor a BalLb(Jnos) Jnos kirly bal lbt jelli. Ezen a mdon az interpretci rgzti minden
termnek a referenciit.
A -kifejezsek ( -expressions) hasznos jellst biztostanak, amelyek az j fggvnyszimblumokat futsi idben hozzk ltre. Pldul a
fggvny, amely ngyzetre emeli a szmokat, lerhat gy, hogy ( x x x), s alkalmazhat az argumentumokra, akr brmely ms
fggvnyszimblum. Egy -kifejezst gy is meghatrozhatunk s hasznlhatunk, mint egy prediktumszimblumot (lsd 22. fejezet). A
Lambda opertor a Lispben pontosan ugyanezt a szerepet jtssza. Vegyk szre, hogy a hasznlata ilyen mdon nem nveli meg az
elsrend logika formlis kifejezerejt, mert az a mondat, ami tartalmaz egy -kifejezst, trhat gy, hogy hozzcsatoljuk a
paramtereket, ami egy ugyanolyan mondatot eredmnyez.
4
222
Created by XMLmind XSL-FO Converter.
Elsrend logika
mondatot egy prediktumszimblum s az azt kvet zrjelezett listban tallhat termek listja alkot. Pldul
a
Testvr(Richrd, Jnos)
azt jelenti egy korbban megadott szndkolt interpretci szerint, hogy Oroszlnszv Richrd testvre Jnos
kirlynak.5 Az atomi mondatoknak is lehetnek sszetett termek az argumentumai. gy teht a
Hzas(Apja(Richrd), Anyja(Jnos))
azt jelenti, hogy Oroszlnszv Richrd apja felesgl vette Jnos kirly anyjt (ismt csak egy alkalmas
interpretciban).
Fontos
Egy atomi mondat igaz (true) egy adott modellben, egy adott interpretci mellett, ha a relci, amire
a prediktumszimblum vonatkozik, fennll az argumentumok ltal jellt objektumok kztt.
2.6. Kvantorok
Ha egyszer ltrehoztunk egy objektumokat is tartalmaz logikt, termszetes, hogy objektumok egsz
gyjtemnyeire vonatkoz tulajdonsgokat is ki akarunk fejezni anlkl, hogy az objektumokat nevk
felhasznlsval fel kellene sorolni. Ezt a kvantorok (quantifiers) alkalmazsa teszi lehetv. Az elsrend
logika kt standard kvantort tartalmaz, amelyeket univerzlis s egzisztencilis kvantoroknak neveznk.
A -t ltalban Minden re-nek olvassuk ki. A mondat teht azt jelenti: Minden x-re, ha x egy kirly, akkor
x egy szemly. Az x szimblum neve vltoz (variable). A konvenci alapjn a vltozkat kisbetvel rjuk.
Egy vltoz nmagban egy term, s mint olyan, szerepelhet egy fggvny argumentumaknt pldul:
BalLb(x). Egy vltoz nlkli termet alaptermnek (ground term) neveznk.
Egyszeren a x P mondat, ahol a P egy tetszleges logikai kifejezs, azt mondja ki, hogy a P igaz minden x
objektumra. Pontosabban, x P igaz egy adott modellre az interpretcin bell, ha P igaz minden lehetsges
kiterjesztett interpretciban (extended interpretations), amelyet az adott interpretci felhasznlsval
hozunk ltre, ahol minden egyes kiterjesztett interpretci meghatroz egy trgyterletelemet, amire az x
vonatkozik.
Rendszerint kvetjk az argumentumok rendezsnek konvencijt, amely szerint a P(x,y)-t gy rtelmezzk, hogy az x az y-nak a P-je.
223
Created by XMLmind XSL-FO Converter.
Elsrend logika
Ez bonyolultnak hangzik, de valjban csak egy vatos mdja annak, hogy megllaptsuk az univerzlis
kvantorok intuitv jelentst. Tekintsk a 8.2. brt s a hozz tartoz szndkolt interpretcit. tfle mdon
tudjuk kiterjeszteni az interpretcit:
x Oroszlnszv Richrd
x Jnos kirly
x Richrd bal lba
x Jnos bal lba
x a korona
Nzzk meg alaposan ezt az lltshalmazt. Mivel a mi modellnkben Jnos kirly az egyetlen kirly, a msodik
mondat kijelenti, hogy egy szemly, ahogy azt remltk is. De mi a helyzet a tbbi ngy mondattal, amelyek
azrt szerepelnek, hogy lltsokat fogalmazzanak meg lbakrl s koronkrl? Rsze ez annak a jelentsnek,
hogy Minden kirly szemly? Valjban, a tbbi ngy llts is igaz a modellben, de egyltaln nem lltanak
semmit a lbak, koronk vagy akr Richrd szemlyes tulajdonsgairl. Ez azrt van, mert ezen objektumok
egyike sem kirly. Ha megnzzk a () sszektjel igazsgtbljt (7.8. bra), lthatjuk, hogy az implikci
igaz, amikor a premisszja hamis tekintet nlkl a konklzi igazsgtartalmra. gy teht az univerzlis
kvantorral elltott mondat kijelentse egyenrtk azzal, hogy egyedi implikcik teljes listjt definiljuk.
Vgl is egy szably konklzijt adjuk meg azokra az objektumokra, amelyek premisszja igaz, de nem
mondunk egyltaln semmit azokrl az egyedekrl, akikre nzve a premissza hamis. gy az implikci
igazsgtbljnak sorai tkletesnek bizonyulnak univerzlis kvantorokat tartalmaz ltalnos szablyok
megrshoz.
Gyakori hiba, amelyet mg figyelmes olvask is elkvetnek, akik pedig mr tbbszr is elolvastk ezt a
bekezdst, hogy konjunkcit hasznlnak implikci helyett. A
x Kirly(x) Szemly(x)
Elsrend logika
rtheten fogalmazva, az x P mondat azt jelenti, hogy a P legalbb egy x objektumra igaz. Pontosabban az x
P igaz egy adott modellben, egy adott interpretcin bell, ha a P igaz legalbb egy kiterjesztett
interpretciban, amely az x-et a tartomny egy elemhez rendeli. A mi pldnkban ez azt jelenti, hogy a
kvetkez lltsok kzl legalbb egy igaz:
Oroszlnszv Richrd egy korona Oroszlnszv Richrd Jnos fejn van
Jnos kirly egy korona Jnos kirly Jnos fejn van
Richrd bal lba egy korona Richrd bal lba Jnos fejn van
Jnos bal lba egy korona Jnos bal lba Jnos fejn van
A korona egy korona a korona Jnos fejn van
Az tdik llts igaz a modellben, gy az eredeti egzisztencilis kvantorral elltott mondat igaz a modellben.
Vegyk szre, hogy defincink szerint a mondat igaz lenne egy olyan modellben is, ahol Jnos kirly kt
koront visel. Ez teljes mrtkben konzisztens az eredeti mondattal, miszerint Jnos kirlynak korona van a
fejn.6
Mint ahogy termszetesnek tnik az hasznlata sszektjelnek a hasznlatakor, az az a termszetes
sszektjel, amit az -vel hasznlunk. Az hasznlata f sszektjelknt az -val tlsgosan is ers
lltsokhoz vezetett az elz alfejezetben trgyalt pldban; a hasznlata az -vel igazbl nagyon gyenge
lltshoz vezet:
x Korona(x) Fejn(x, Jnos)
A felsznen ez a mondatunk elfogadhat trsnak tnik. A szemantikt alkalmazva ltjuk, hogy a mondat azt
jelenti ki, hogy a kvetkez lltsok legalbb egyike igaz:
Oroszlnszv Richrd egy korona Oroszlnszv Richrd Jnos fejn van
Jnos kirly egy korona Jnos kirly Jnos fejn van
Richrd bal lba egy korona Richrd bal lba Jnos fejn van
s gy tovbb. Mrmost, egy implikci akkor igaz, ha a premissza s a konklzi egyarnt igaz, vagy ha a
premisszja hamis. Teht ha Oroszlnszv Richrd nem egy korona, akkor az els llts igaz, s az
egzisztencilis kvantort kielgtettk. gy teht egy egzisztencilis kvantort tartalmaz implikcis mondat igaz
brmely olyan modellben, amely tartalmaz egy olyan objektumot, amelyre az implikci premisszja hamis;
kvetkezskppen az ilyen mondatok valjban nem tl sokat mondanak.
y Fivr(x, y) Testvr(x, y)
Az egymst kvet azonos tpus kvantorokat rhatjuk gy is, hogy egy kvantort alkalmazunk az sszes
vltozra. Pldul hogy azt lltsuk, a testvrsg egy szimmetrikus kapcsolat, ezt rhatjuk:
x, y Testvr(x, y) Testvr(y, x)
Ms esetekben kevert jellssel van dolgunk. A mindenki szeret valakit azt jelenti, hogy minden szemlyhez
tartozik valaki, akit a szemly szeret:
x
y Szeret(x, y)
Ltezik az egzisztencilis kvantornak egy varinsa, amelyet 1-gyel vagy !-lel jellnk, s ami azt jelenti, hogy Ltezik pontosan
egy. Ugyanez a jelents kifejezhet egyenlsglltsokkal is, mint azt a 8.2. alfejezetben bemutattuk.
6
225
Created by XMLmind XSL-FO Converter.
Elsrend logika
Msrszt, hogy azt lltsuk: Van valaki, akit mindenki szeret, ezt rjuk:
y
x Szeret(x, y)
Itt az x a Fivr(Richrd, x)-ben egzisztencilis kvantorral van elltva. Az a szably, hogy a vltoz ahhoz a
legbels kvantorhoz tartozik, ami a vltozt megemlti, s utna a vltoz nem trgya semmilyen kvantor
alrendelsnek.7
A msik mdja a megoldsnak: x Fivr(Richrd, x), ahol ez egy Richrdrl szl mondat (hogy neki van egy
fivre), s nem pedig az x-rl. gy teht annak nem lesz hatsa, ha kvl el tesznk egy x-et. ppen gy
rhattuk volna azt is, hogy z Fivr(Richrd, z). Mivel ez tveszts forrsa lehet, ezrt mindig klnbz
vltozkat fogunk hasznlni.
2.10. Az s az kapcsolata
A kt kvantor valjban szoros kapcsolatban ll egymssal a negcin keresztl. Ha valaki azt mondja, hogy
mindenki utlja a paszternkot, akkor egyttal azt is mondja, hogy nem ltezik olyan valaki, aki szereti azt, s
fordtva:
x Szereti(x, Paszternk) egyenrtk azzal, hogy x Szereti(x, Paszternk)
Egy lpssel tovbb is mehetnk. A Mindenki szereti a fagylaltot mondat azt jelenti, hogy nincs olyan, aki ne
szeretn a fagylaltot:
x Szereti(x, Fagylalt) egyenrtk azzal, hogy x Szereti(x, Fagylalt)
Mivel az igazbl egy konjunkci minden univerzumbeli objektum felett, az pedig egy diszjunkci
ugyanezen objektumok felett, ezrt nem meglep, hogy eleget tesznek a De Morgan-szablyoknak. A kvantorral
s a kvantor nlkl ll mondatokra vonatkoz De Morgan-szablyok a kvetkezk:
x P x P
x
P x P
Q (P Q)
(P Q) P Q
x P x P
P Q (P Q)
x P x P
P Q (P Q)
gy valjban nincs szksgnk egyszerre mind az -ra, mind az -re, mint ahogy nincs szksg egyszerre
mind az -ra s az -ra sem. Mgis, mivel az olvashatsg fontosabb, mint a takarkossg, hasznlni fogjuk
mindkt kvantort.
2.11. Egyenlsg
Az azonos vltoznevet hasznl kvantorok interferencira val kpessge teszi lehetv a kiterjesztett interpretcik kiss barokkos
mechanizmust a kvantorral elltott mondatok szemantikjban. Az intuitve legegyrtelmbb megkzeltse az objektumok
helyettestsnek az x minden elfordulsnl nem mkdik a pldnkban, mert az x-et a Fivr(Richrd, x)-ben foglyul ejten a
behelyettests. A kiterjesztett interpretcik ezt pontosabban oldjk meg, mert a bels kvantor hozzkapcsolsa az x termhez kioltja a kls
kvantor hatst.
7
226
Created by XMLmind XSL-FO Converter.
Elsrend logika
Az elsrend logika a prediktumok s termek korbban lert hasznlatn kvl mg egy lehetsget nyjt atomi
mondatok ksztsre. Alkalmazhatjuk az egyenlsgszimblumot (equality symbol) lltsok ksztsre is
annak kifejezsre, hogy kt term ugyanarra az objektumra vonatkozik. Pldul az
Apja(Jnos) = Henrik
azt mondja ki, hogy az Apja(Jnos) ltal hivatkozott objektum s a Henrik ltal hivatkozott objektum azonos.
Mivel az interpretci rgzti brmely term referenciit, egy egyenlsgi llts igazsgnak megllaptshoz
elegend azt ltni, hogy a kt term referencii ugyanazok az objektumok.
Az egyenlsgszimblumot hasznlhatjuk arra, hogy tnyeket llaptsunk meg egy adott fggvnyrl, ahogy ezt
megtettk az imnt az Apja szimblummal. Alkalmazhatjuk az egyenlsgszimblumot negcival is, annak a
kifejezsre, hogy kt term nem ugyanaz az objektum. Ha azt akarjuk lltani, hogy Richrdnak legalbb kt
fivre van, ezt rjuk:
x,y Fivr(x, Richrd) Fivr(y, Richrd) (x = y)
nem ugyanaz a szndkolt jelentse. Ez a mondat pldul igaz a 8.2. brn lthat modellre, ahol Richrdnak
csak egy fivre van. Hogy ezt megrtsk, figyeljk meg azt a kiterjesztett interpretcit, ahol mind az x, mind az
y Jnos kirlyhoz van rendelve. A (x = y) viszont mr nem eleme a modellnek. Az x y-t nha rvidtsknt
hasznljuk a (x = y) kifejezsre.
igazat ad vissza. A KRDEZ-zel feltett krdseket lekrdezseknek (queries) vagy cloknak (goals) nevezzk
(ne tvesszk ssze azokkal a clokkal, amelyek az gensek kvnt llapott rjk le). ltalnossgban, brmely
lekrdezsre, ami logikusan kvetkezik a tudsbzisbl, igenl vlaszt kell adni. Pldul ha adott a kt kijelents
az elz bekezdsben, akkor a
Krdez(TB, Szemly(Jnos))
lekrdezsnek szintn azt kell visszaadnia, hogy igaz. Kvantorokat alkalmaz krdseket is feltehetnk, gy
mint:
227
Created by XMLmind XSL-FO Converter.
Elsrend logika
Krdez(TB, x Szemly(x))
Erre a lekrdezsre a vlasz lehet igaz, de ez nem segt, s nem is szrakoztat. (Ez olyasmi, mintha a Meg
tudn mondani mennyi az id? krdsre azt vlaszolnnk, hogy Igen.) Egy egzisztencilis vltozkkal
elltott lekrdezs valjban azt a krdst teszi fel, hogy Van-e olyan x, amely, s gy oldjuk meg, hogy
megadunk egy ilyen x-et. Egy ilyen tpus vlasz szoksos formja egy helyettestsi lista (substitution list)
vagy lektsi lista (binding list), amely vltoz/term prok halmaza. Ebben az esetben, amikor csak kt
kijelents szerepel, a vlasz az {x/Jnos} lenne. Ha tbb lehetsges vlasz van, akkor a helyettestsek listjt
kapjuk vissza.
Folytathatnnk gy tovbb, s a 8.11. feladatban krni is fogjuk, hogy tegye ezt meg.
Minden egyes ilyen mondat tekinthet a rokonsgi trgyterlet egy aximjnak (axiom). Az aximkat
ltalban a tisztn matematikai trgyterletekhez ktjk rviden meg fogunk vizsglni nhny aximt
szmokra de valamennyi trgyterletben szksg van rjuk. Az aximk elltnak bennnket alapvet tnybeli
informcikkal, amelyekbl hasznos kvetkeztetseket vonhatunk le. Rokonsgi aximink egyttal defincik
(definitions) is; formjuk pedig x, y P(x, y) . Az aximk meghatrozzk az Anyja fggvnyt s a Frje,
Frfi, Szlje, Nagyszlje s Testvre prediktumokat ms prediktumok felhasznlsval. A prediktumok
alapvet halmazainl (Gyereke, Hzastrsa s N) a definciinkat mr nem tudjuk ms prediktumokkal lerni.
Ez termszetes mdja annak, ahogyan felptjk egy trgyterlet reprezentcijt, s analg azzal, ahogyan a
szoftvereket felptik primitv knyvtrfggvnyek szubrutinjainak az egymst kvet definciival. Vegyk
szre, hogy a prediktumprimitveknek nincs felttlenl egyetlen kizrlagos halmaza; ppen ilyen jl
hasznlhattuk volna a Szlje, Hzastrsa s Frfi prediktumokat. Nhny trgyterletben, mint azt ltni
fogjuk, nincs egyrtelmen meghatrozhat alaphalmaz.
228
Created by XMLmind XSL-FO Converter.
Elsrend logika
Nem minden a trgyterletrl szl logikus mondat axima. Nhny kzlk ttel (theorem) amelyeket az
aximk vonnak maguk utn. Pldul vizsgljuk meg a kijelentst, hogy a testvrsg szimmetrikus:
x, y Testvre(x, y) Testvre(y, x)
Ez vajon egy axima vagy egy ttel? Valjban ez egy ttel, amely logikusan kvetkezik a testvrsget
meghatroz aximbl. Ha ezt a mondatot KRDEZ-zk a tudsbzistl, akkor az eljrsnak az igaz eredmnyt
kell visszaadnia.
Tisztn logikai nzpontbl egy tudsbzis csak aximkat, s nem tteleket tartalmaz, mert a ttelek nem
nvelik meg a konklzik halmazt, amelyeket a tudsbzis maga utn vonz. Gyakorlati szempontbl a ttelek
elengedhetetlenek az j mondatok ellltsnl a szmtsi kltsgek cskkentshez. Nlklk egy bizonytsi
rendszernek minden egyes alkalommal az els alapelvektl kellene indulnia, mintha egy fizikusnak mindig jra
le kellene vezetnie a szmtsok szablyait az sszes j problmnl.
Nem minden axima definci. Nhny axima ltalnosabb informcikat r le egyes prediktumokrl, anlkl
hogy ltrehozna egy defincit. Valjban egyes prediktumoknak nincs teljes defincijuk, mert nem tudunk
eleget rluk ahhoz, hogy teljes mrtkben meghatrozzuk ket. Pldul nem ltezik egyrtelm befejezse a
kvetkez mondatnak:
x Szemly(x)
Szerencsre az elsrend logika lehetv teszi szmunkra, hogy hasznljuk a Szemly prediktumot, anlkl
hogy teljes mrtkben definilnnk. Ehelyett rszleges pontostsokat rhatunk tulajdonsgokrl, amelyekkel
minden szemly rendelkezik, s olyan tulajdonsgokrl, amelyek valamit szemlly tesznek:
x Szemly(x)
x Szemly(x)
Az aximk lehetnek csak puszta tnyek, mint amilyenek a Frfi(Jim) s a Hzastrsa(Jim, Laura). Az ilyen
tnyek alkotjk a specilis problma pldnyok lersait, lehetv tve specilis krdsek megvlaszolst.
Ilyenkor az ezekre a krdsekre adott vlaszok ttelek lesznek, amelyek az aximkbl kvetkeznek. Gyakran
elfordul, hogy az elvrt vlasz nem kaphat meg pldul a Frfi(George) s a Hzastrsa(George, Laura)bl azt vrnnk, hogy kikvetkeztethetnek kellene lennie annak, hogy N(Laura); de ez nem kvetkezik a
korbban megadott aximkbl. Ez annak a jele, hogy egy axima hinyzik. A 8.8. feladat ennek a megadst
kri.
Ez azt jelenti, hogy a 0 egy termszetes szm, s hogy minden n objektumra, ha az n egy termszetes szm,
akkor S(n) is egy termszetes szm. Teht, a termszetes szmok a 0, az S(0) s az S(S(0)) s gy tovbb.
Szksgnk van aximkra ahhoz is, hogy lezrjuk a rekurzit ler fggvnyt:
n 0 S(n)
m, n m n S(m) S(n)
229
Created by XMLmind XSL-FO Converter.
Elsrend logika
m TermSzm(m) + (0, m) = m
m, n TermSzm(m) TermSzm(n) + (S(m), n) = S(+(m, n))
Az els axima azt mondja ki, hogy ha hozzadunk egy 0-t brmely m termszetes szmhoz, akkor m-et kapunk.
Figyeljk meg a + binris fggvnyszimblum hasznlatt a +(m, 0) termben. A matematika jellse szerint a
termet a kvetkezkppen rnnk: m + 0, infix (infix) jells hasznlatval. (Az eddigiekben az elsrend
logikhoz hasznlt jellseket prefixnek (prefix) nevezzk.) Azrt, hogy knnyebben olvashatv tegyk a
szmokrl szl mondatainkat, lehetv tesszk az infix jellsek hasznlatt. gy az S(n)-t lerhatjuk gy is,
hogy n + 1, ami ltal a msodik axima a kvetkez lesz:
m, n TermSzm(m) TermSzm(n) (m + 1) + n = (m + n) + 1
2. Az res halmaznak nincs hozzadott eleme, ms szval nincs lehetsg arra, hogy az resHalmaz-t
sztvlasszunk egy kisebb halmazra s egy elemre:
x, s {x|s} = { }
4. Egy halmaznak csak az az eleme, amit hozzadunk. Ezt rekurzvan fejezzk ki, kimondva, hogy x akkor s
csakis akkor eleme az s halmaznak, ha s azonos valamilyen s2 halmaz y elemmel val bvtsvel, ahol vagy
azonos y x-szel, vagy x eleme s2-nek:
x, s x s [y, s2 (s = {y|s2} (x = y x s2))]
5. Egy halmaz egy msiknak a rszhalmaza, ha az sszes els halmazbeli elem eleme a msodik halmaznak:
s1, s2 s1 s2 (x x s1 x s2)
230
Created by XMLmind XSL-FO Converter.
Elsrend logika
x, s1, s2 (s1 = s2) (s1 s2 s2 s1)
7. Egy objektum akkor s csakis akkor eleme kt halmaz metszetnek, ha eleme mindkt halmaznak:
x, s1, s2 x (s1 s2) (x s1 x s2)
8. Egy objektum akkor s csakis akkor eleme kt halmaz unijnak, ha a kt halmaz brmelyiknek az eleme:
x, s1, s2 x (s1 s2) (x s1 x s2)
A listk (lists) trgykre nagyon hasonl a halmazok trgykrhez. A klnbsg az, hogy a listk rendezettek,
s ugyanaz az elem tbb helyen is elfordulhat egy listban. Hasznlhatjuk a Lisp sztrt a listkra: a Nil az
elem nlkli listt jell konstans, a Cons, az Append, a First s a Rest fggvnyek. A Find egy prediktum,
amely azt hajtja vgre a listknl, mint az Eleme a halmazoknl. A List? egy prediktum, amely csak a listkra
igaz. gy, mint a halmazoknl, a listkrl szl logikai mondatokban is szoks hasznlni a szintaktikai
dessget. Az res lista a: [ ]. A Cons(x, y) termet, ahol az y nem res lista, gy rjuk, hogy: [x|y]. A Cons(x, Nil)
termet (egy lista, amely tartalmazza az x elemet) gy rjuk, hogy: [x]. Tbb elem listja, mint az [A, B, C],
ugyanazt jelenti, mint az egymsba gyazott term: Cons(A, Cons(B, Cons(C, Nil))). A 8.14. feladat trgya az
aximk megrsa a listk trgykrhez.
Itt az rzet egy binris prediktum, mg a Bz s a tbbi rzet listba rendezett konstansok. A wumpus vilgban
lejtszd cselekvseket a kvetkez logikai termekkel reprezentlhatjuk:
Fordul(Jobbra), Fordul(Balra), Elre, L, Megragad, Elereszt, Mszik
Hogy meghatrozzuk, melyik cselekvs a legjobb az adott helyzetben, az gens program ltrehoz egy
lekrdezst, mint pldul:
a LegjobbCselekvs(a, 5)
A KRDEZ-zel vgrehajtjuk ezt a lekrdezst, s vissza fogunk kapni egy lektsi listt, mint pldul:
{a/Megragad}. Az gensprogram ezutn visszaadhatja a Megragad-ot, mint elvgzend cselekvst, de elszr a
KIJELENT felhasznlsval kzlnie kell a sajt tudsbzisval, hogy egy Megragad-ot hajt vgre.
A nyers rzetadatok alapjn kvetkeztethetnk az aktulis llapot bizonyos tnyeirl. Pldul:
t, s, g, m, c rzet([s, Szell, g, m, c], t) Szell(t)
t, s, g, m, c rzet([s, Ragyogs, m, c], t) Ragyogs(t)
s gy tovbb. A szablyok a kvetkeztetsi folyamat egy trivilis formjt mutatjk, amit rzkelsnek
(perception) neveznk, s amelyet a 24. fejezetben fogunk rszletesen tanulmnyozni. Vegyk szre az
univerzlis kvantort az id (t) felett. Az tletlogikban minden egyes idlpshez szksgnk volt a mondatok
msolatra.
Az egyszer reflex viselkeds is lerhat kvantorokat alkalmaz implikcis mondatokkal. Pldul lehet egy
ilyen mondatunk:
t Ragyogs(t) LegjobbCselekvs(Megragad, t)
231
Created by XMLmind XSL-FO Converter.
Elsrend logika
Mivel adottak az rzet s az elz bekezdsekben megismert szablyok, ez a mondat a kvnt konklzit
eredmnyezn: LegjobbCselekvs(Megragad, 5) ami azt jelenti, hogy a Megragad a legjobb cselekvs, amit
vgrehajthatunk. Vegyk szre az egybeesst a 7.20.
brban az ramkrn alapul gensnl e szably s a
kzvetlen rzet-cselekvs kapcsolat kztt. Az ramkr jellegbl kvetkezen impliciten ltja el kvantorral az
idt.
Eddig ebben az alfejezetben az idvel operl mondatok mind szinkrnok (synchronic), azaz egyidejek
voltak, ami azt jelenti, hogy a vilg llapotnak tulajdonsgait vonatkoztatjk ugyanannak a vilgllapotnak ms
tulajdonsgaihoz. Azokat a mondatokat, amelyek lehetv teszik az idbelisget figyelembe vev kvetkeztetst
diakrnnak (diachronic) nevezzk. Pldul az gensnek tudnia kell, hogy hogyan kombinlja a megelz
helyzetrl lv informcit azzal az informcival, amely helyzetnek meghatrozshoz szksges. A diakrn
mondatok trgyalst elhalasztjuk a 10. fejezetig, most csak ttelezzk fel, hogy a helyzetre s ms idfgg
prediktumokra vonatkoz kvetkeztetsek megtrtntek.
Bemutattuk az rzeteket s a cselekvseket, ezutn itt az ideje, hogy bemutassuk magt a krnyezetet. Kezdjk
az objektumokkal. A ngyzetek, a csapdk s a wumpus nyilvnval szereplk. Elnevezhetnnk minden egyes
ngyzetet Ngyzet1,2 s gy tovbb de akkor az a tny, hogy a Ngyzet1,2 szomszdos a Ngyzet1,3-mal, egy
extra tnyt ignyelne, s minden egyes ngyzetprnl szksgnk lenne egy ilyen tnyre. Jobb egy komplex
termet hasznlni, amelyben a sor s az oszlop egsz szmokknt jelenik meg; pldul egyszeren hasznlhatjuk
a lista termet: [1, 2]. Brmely kt ngyzet szomszdossga meghatrozhat gy:
x, y, a, b Szomszdos([x, y], [a, b])
[ a, b] {[x + 1, y], [x 1, y], [x, y + 1], [x, y 1]}
Minden egyes csapdt elnevezhetnnk, de ez sem lenne megfelel, mghozz ms okbl: nincs ok arra, hogy
megklnbztetst tegynk a csapdk kztt.9 Sokkal egyszerbb hasznlni egy Csapda unris prediktumot,
amely igaz a csapdt tartalmaz ngyzetekre. Vgl, mivel pontosan egy wumpus van csak, ezrt egy Wumpus
konstans ppen gy megfelel, mintha egy unris prediktummal jellnnk (s a wumpus szempontjbl taln
tiszteletre mltbb is). A wumpus pontosan egy ngyzetben lakik, teht j gondolat egy fggvnyt hasznlni
ennek a ngyzetnek a megnevezsre, ami az Otthon(Wumpus). Ez kikszbli azt a szmos mondatot, amelyre
az tletlogikban szksgnk van ahhoz, hogy megmondjuk, pontosan egyetlen ngyzet tartalmaz wumpust.
(Mg nehezebb helyzetet teremtene az tletlogika szmra, ha kt wumpus volna.)
Az gens helyzete vltozik az id haladtval, amit gy jellnk, hogy Akkor(gens, s, t), ami azt jelenti, hogy az
gens az s ngyzetnl van t idben. Mihelyt megadtuk az aktulis helyzett, az gens kvetkeztetni tud a
ngyzet tulajdonsgaira a jelenlegi rzete tulajdonsgaibl. Pldul, ha az gens egy ngyzetnl van, s szellt
rzkel, akkor az a ngyzet szells:
s, t Akkor(gens, s, t) Szell(t) Szells(s)
Hasznos tudni, hogy egy ngyzet szells, mert tudjuk, hogy a csapdk nem tudnak mozogni. Vegyk szre, hogy
a Szells-nek nincsen idargumentuma.
Miutn felfedeztk, mely helyek szellsek (vagy bdsek) vagy s ez nagyon fontos nem szellsek (vagy
nem bdsek), az gens ki tudja kvetkeztetni, hogy hol vannak a csapdk (s hogy hol van a wumpus). Ktfajta
szinkrn szably van, amely lehetv teszi az ilyen kvetkeztetseket:
Diagnosztikus szablyok
A diagnosztikus szablyok a megfigyelt hatsoktl a rejtett okokhoz vezetnek minket. A csapdk
megtallshoz a legkzenfekvbb diagnosztikai szablyok azt mondjk ki, hogyha a ngyzet szells, akkor
valamelyik szomszdos ngyzet biztosan tartalmaz csapdt:
s Szells(s) r Szomszdos(r, s) Csapda(r)
s hogyha egy ngyzet nem szells, akkor egyetlen szomszdos ngyzet sem tartalmaz csapdt: 10
Hasonlan, legtbbnk nem nevezi meg a madarat, amint elszll fejnk felett, hogy melegebb vidkre kltzzn tlen. Egy ornitolgus
viszont, aki a vonulsi mintkat s a tllsi arnyokat szeretn tanulmnyozni, megnevez minden egyes madarat azltal, hogy meggyrzi
ket, mivel a madarakat egyenknt kell nyomon kvetnie.
10
Az emberben van hajlandsg arra, hogy elfelejtse lerni az ehhez hasonl negatv informcikat. Egy beszlgets sorn ez a tendencia
teljesen normlis furcsa lenne, ha azt mondannk: Van kt cssze az asztalon, s nincs ott hrom vagy tbb. Mg akkor is, ha a Van kt
cssze az asztalon szigoran szlva akkor is igaz, ha hrom van ott. A 10. fejezetben visszatrnk erre a problmra.
9
232
Created by XMLmind XSL-FO Converter.
Elsrend logika
s Szells(s) r Szomszdos(r, s) Csapda(r)
Ok-okozati szablyok
Az ok-okozati szablyok a vilgban lv okozatisg felttelezett irnyt tkrzik: a vilg nhny rejtett
tulajdonsga bizonyos rzetek generlst eredmnyezi. Pldul egy csapda azt eredmnyezi, hogy az sszes
szomszdos ngyzet szells lesz:
r Csapda(r) [s Szomszdos(r, s) Szells(s)]
s ha az adott ngyzettel szomszdos ngyzetek egyike sem tartalmaz csapdt, a ngyzet nem lesz szells:
s [r Szomszdos(r, s) Csapda(r)] Szells(s)
Nmi munkval meg lehet mutatni, hogy ezek a mondatok egytt logikusan egyenrtkek a (8.3) egyenletben
lert ekvivalenciamondatokkal. Maga az ekvivalencia is tekinthet ok-okozatinak, mert megmutatja, hogy a
Szells igazsgrtke a vilg llapota alapjn hatrozhat meg.
Azokat a rendszereket, amelyek ok-okozati szablyokat alkalmaznak modellalap kvetkeztet (modell-based
reasoning) rendszereknek nevezzk, mivel az ok-okozati szablyok a krnyezet mkdsnek modelljt
alkotjk. A modellalap s a diagnosztikus kvetkeztets kztti megklnbztets a mestersges intelligencia
szmos terletn fontos. Az orvosi diagnosztika egy klnsen aktv terlete a kutatsnak, amelyben a tnetek
s a betegsgek kztti kzvetlen asszocicikon alapul (diagnosztikai megkzeltsek) megkzeltseket
fokozatosan felvltottk az olyan mdszerek, amelyek a betegsg kialakulsnak s a betegsgtnetek
manifesztldsnak egy explicit modelljt hasznljk. Ez a tma a 13. fejezetben jra elkerl.
Fontos
Brmelyik reprezentcis formt is hasznlja az gens, ha az aximk pontosan s teljesen lerjk a
vilg mkdsnek a mdjt s azt a mdot, ahogyan az rzetek ltrejnnek, akkor brmely teljes
logikai kvetkeztetsi eljrs az elrhet rzetek megadsa utn ki fogja kvetkeztetni a vilg
llapotnak legvalsznbb lehetsges lerst. gy teht az genstervez arra koncentrlhat, hogy a
tudst helyesen adja meg, anlkl hogy sokat kellene tprengenie a kvetkeztetsek folyamatain.
Lttuk tovbb azt is, hogy az elsrend logika hasonlan tmren tudja reprezentlni a wumpus
vilgot, mint a 7. fejezetben megadott eredeti magyar nyelv lers.
233
Created by XMLmind XSL-FO Converter.
Elsrend logika
cselekvsek kivlasztsra, vagy hogy csak az vrhat el, hogy a krnyezet elemeivel kapcsolatos krdseket
vlaszolja meg. Tudnia kell, hogy az rzkelktl szrmaz tnyek lerjk-e a jelenlegi helyzetet. A feladat
hatrozza meg, hogy mely tudst kell trolni, hogy a problmapldnyokban a vlaszokat megadhassuk az
adott esetre vonatkozan. Ez a lps analg az gensek tervezsnl ltott TKB-folyamattal, amelyrl a 2.
fejezetben rtunk.
2. A relevns tuds sszegyjtse. A tudsmrnk vagy mr szakrtje a trgyterletnek, vagy egytt kell
mkdnie igazi szakrtkkel, hogy megismerje az tudsukat ezt a folyamatot tudsmegszerzsnek
(knowledge acquisition) nevezzk. Ezen a szinten a tudst formlisan nem reprezentljuk. A cl az, hogy
megrtsk a tudsbzis trgykrt, amit a feladat hatrol be, s meg kell rteni azt is, hogy a trgyterlet
hogyan mkdik a gyakorlatban.
A wumpus vilgban, amelyet mestersgesen ltrehozott szablyrendszer hatroz meg, knny az idevonatkoz
tudsbzist azonostani. (Vegyk szre azonban, hogy a szomszdossg defincija nem volt explicit megadva a
wumpus vilg szablyaiban.) A valdi trgyterletekben a relevancia problmja meglehetsen bonyolult lehet
pldul egy VLSI tervez szimulcis rendszernek figyelembe kell vennie a szrt kapacitsokat s a felleti
hatsokat.
3. Meg kell hatrozni a prediktumok, fggvnyek s konstansok sztrt. Ez azt jelenti, hogy a fontos
trgyterlet szint koncepcikat le kell fordtani logikai szint nevekre. Ez szmos, a megkzelts jellegt
trgyal krdst rint. Hasonlan, mint a programozsi stlusnak, ennek is jelents hatsa lehet a projekt
vgs sikerre. Pldul ilyen krds, hogy a csapdkat vajon objektumok jelentsk-e meg vagy egy a
ngyzetekre vonatkoz unris prediktum? Az gens irnya fggvny legyen-e vagy prediktum? A wumpus
helyzete az idtl fggjn-e? Mihelyt a vlaszts megtrtnt, az eredmny egy sztr, amit a trgyterlet
ontolgijnak (ontology) nevezznk. Az ontolgia fogalma egy olyan elmletet takar, ami a ltezs
termszett rja le. Meghatrozza, hogy milyen dolgok lteznek, de nem hatrozza meg a rjuk jellemz
tulajdonsgokat, sem a kztk fennll kapcsolatokat.
4. A trgyterletrl szl ltalnos tuds kdolsa. A tudsmrnk lerja a sztr szszes termjhez tartoz
aximkat. Ez lergzti (amennyire lehetsges) a termek jelentst, s lehetv teszi a szakrt szmra a
tartalom ellenrzst. Ez a lps gyakran feltrja a flrertelmezseket vagy a hinyossgokat a sztrban,
amelyeket a 3. lpshez jra s jra visszatrve, iteratv eljrssal javthatunk.
5. Az adott problma pldny lersnak kdolsa. Ha az ontolgia jl tgondolt, ez a lps mr knny lesz.
Egyszer atomi mondatokat kell az ontolgiban mr lert fogalmak pldnyaira megfogalmazni. Egy logikai
gens szmra a problmapldnyokat az rzkelk biztostjk, amikor a klnll tudsbzist kiegsztik
mondatokkal ugyangy, ahogy a hagyomnyos programoknak bemeneti adatokat adunk meg.
6. Lekrdezseket fogalmazunk meg a kvetkeztetsi folyamat szmra s vlaszokat vezetnk le. Itt kapjuk meg
az eddigi munknk jutalmt: mkdtethetjk a kvetkeztetsi folyamatot az aximkon s a
problmaspecifikus tnyeken, hogy megkapjuk a minket rdekl tnyeket.
7. Szrjk ki a hibkat a tudsbzisbl. Sajnos az els prblkozsra a krdsekre kapott vlaszok nagyon
ritkn lesznek helyesek. Pontosabban, a vlaszok helyesek lesznek a megadott tudsbzis szempontjbl,
felttelezve, hogy a kvetkeztetsi folyamat megfelel, de a vlaszok nem azok lesznek, amiket a felhasznl
vr. Pldul ha hinyzik egy axima, akkor bizonyos krdsek megvlaszolhatatlanok lesznek a tudsbzis
alapjn. Ilyenkor egy hibajavtsi folyamatra van szksg. A hinyz vagy tl gyenge aximk knnyen
megtallhatk gy, hogy felfedezzk azokat a helyeket, ahol a kvetkeztets lnca vratlanul megszakad.
Pldul ha a tudsbzis tartalmazza az egyik, csapdkra vonatkoz diagnosztikus aximt,
s Szells(s) r Szomszdos(r, s) Csapda(r)
de nem tartalmazza a msikat, akkor az gens soha nem lesz kpes bizonytani a csapdk hinyt. A helytelen
aximk azonosthatk, mivel ezek hamis lltsok a vilgrl. Pldul az a mondat, hogy:
x LbakSzma(x, 4) Emls(x)
Fontos
234
Created by XMLmind XSL-FO Converter.
Elsrend logika
Nem lehet ez alapjn megmondani, hogy a mondat helyes-e anlkl, hogy megnznnk a program
tbbi rszt. Pldul azt, hogy az eltols-t a jelenlegi pozcira vonatkozan hasznljuk-e, vagy arra,
amely eggyel a jelenlegi pozci mgtt van, vagy arra, hogy a pozci rtke megvltozott egy msik
llts ltal, s gy az eltols-t is meg kell vltoztatni.
Hogy jobban megrtsk ezt a htlpses folyamatot, alkalmazzuk most egy kiterjesztett pldra az
elektronikus ramkrk trgyterletre.
8.4. bra - Egy C1-es digitlis ramkr, amelynek az a clja, hogy egy egybites teljes
sszeadst vgezzen. Az els kt bemenet az a kt bit, amit ssze kell adni, mg a
harmadik bemenet az tvitel. Az els kimenet az sszeg, mg a msodik kimenet az
tvitel a kvetkez sszead fel. Az ramkr kt XOR, kt AND s egy OR kaput
tartalmaz.
Ez az alfejezet a digitlis ramkrk meglehetsen sajtos bemutatsra vllalkozik. Mikzben nem javasoljuk, hogy valaki ez alapjn
ismerkedjen meg a digitlis ramkrkkel, s esetleg az itt bemutatottak alapjn prbljon digitlis ramkrket tervezni, az itt lertak
mindenkppen rdekes nzpontot tkrznek, s rdekes ksrletet jelentenek arra, hogy az elsrend logika fogalomkszletvel mutassk
be a digitlis ramkrket. (A szerk.)
11
235
Created by XMLmind XSL-FO Converter.
Elsrend logika
Ha a clunk valami ms lenne, s nem a kapuszint tervezs helyessgnek ellenrzse, akkor az ontolgink is
ms lenne. Pldul ha az rdekelne minket, hogyan lehetne a hibkat a hibs ramkrkben megtallni, akkor
valsznleg j tlet lenne a vezetkekkel is foglalkozni az ontolgiban, mivel egy hibs vezetk
meghamisthatja a rajta keresztlhalad jelet. Az idztsi hibk megtallshoz a kapuk ksleltetsvel
kapcsolatos fogalmakat kellene lerni. Ha az rdekelne minket, hogy hogyan lehet egy nyeresges termket
tervezni, akkor az ramkrk kltsgnek s sebessgnek a piacon jelen lv egyb termkekkel trtn
sszehasonlthatsga lenne fontos.
Vegyk szre, hogy megfelel betkkel kezdd neveket hasznltunk A1, X1 s gy tovbb pusztn azrt, hogy knnyebben olvashatv
tegyk a pldt. A tudsbzisnak mg gy is tartalmaznia kell a kapuk tpusra vonatkoz informcikat.
12
236
Created by XMLmind XSL-FO Converter.
Elsrend logika
Ezrt be fogunk vezetni objektumokknt kt jelrtket, az 1-et s a 0-t, valamint egy Jel fggvnyt, aminek
egy vgpont az argumentuma, s ami kijelli ennek a vgpontnak a jelrtkt.
237
Created by XMLmind XSL-FO Converter.
Elsrend logika
A vlaszok az i1, i2 s i3 vltozk behelyettestsei gy, hogy a keletkezett mondat kvetkezzen a tudsbzisbl.
Hrom ilyen behelyettests ltezik:
{i1/1, i2/1, i3/0} {i1/1, i2/0, i3/1} {i1/0, i2/1, i3/1}
Ez az utols lekrdezs egy teljes bemenet-kimenet tblzatot ad meg az eszkzre, amelyet aztn
ellenrizhetnk, hogy valban helyesen adja-e ssze a bemeneteket. Ez egy egyszer plda az ramkr
ellenrzsre (circuit verification). Az ramkr bemutatott defincijt nagyobb digitlis rendszerek ptsre
is felhasznlhatjuk, amelyekre aztn ugyanez a fajta ellenrzsi folyamat alkalmazhat (lsd 8.17. feladat). Sok
trgyterlet kezelhet egy ehhez hasonl strukturlt tudsbzis-fejlesztssel, amelyekben sszetettebb
koncepcikat hatrozunk meg egyszerbb koncepcikra ptve.
ami felfedi, hogy az X1-nl nem ismerjk a kimenetet az 10 s a 01 bemenetek esetn. Ezutn megnzzk az
XOR kapu aximit az X1-re alkalmazva:
Jel(Ki(1, X1)) = 1 Jel(Be(1, X1)) Jel(Be(2, X1))
Most mr lthat, hogy mi a problma oka: a rendszer nem kpes kikvetkeztetni azt, hogy Jel(Ki(1, X1)) = 1,
gy meg kell neki mondanunk, hogy 1 0.
5. sszefoglals
Ebben a fejezetben megmutattuk, hogy hogyan hasznlhat az elsrend logika (first-order logic) egy
tudsalap gens reprezentcis nyelveknt. A legfontosabb megllaptsok a kvetkezk:
A tudsreprezentcis nyelveknek deklaratvnak, kompozcisnak, kifejeznek, a szvegkrnyezettl
fggetlennek s egyrtelmnek kell lennik.
Ez a fajta kihagys elgg gyakori, mert az emberek ltalban felttelezik, hogy a klnbz nevek klnbz dolgokat takarnak. A
logikai programozsi rendszerek, amelyeket bvebben a 9. fejezetben mutatunk be, szintn megteszik ezt a felttelezst.
13
238
Created by XMLmind XSL-FO Converter.
Elsrend logika
239
Created by XMLmind XSL-FO Converter.
Elsrend logika
Szmos sznvonalas, az elsrend logika korszer bevezetst ad rs ismert. Ezek kzl Quine mve az egyik
legjobban ttekinthet (Quine, 1982). Enderton rsa inkbb matematikai megkzeltst kvet (Enderton, 1972).
Bell s Machover ersen formlis lerst ksztett az elsrend logikrl, s ezzel egytt szmos bonyolult, a
logika trgyterletbe tartoz tmrl (Bell s Machover, 1977). Manna s Waldinger a szmtstechnika
oldalrl kzelt, jl olvashat bevezetst ksztett (Manna s Waldinger, 1985). Gallier az elsrend logika
rendkvl precz matematikai bemutatst adta meg, egytt a logika automatikus kvetkeztetsre trtn
alkalmazsnak rszletes trgyalsval (Gallier, 1986). A Logical Foundations of Artificial Intelligence (A
mestersges intelligencia logikai alapjai) (Genesereth s Nilsson, 1987) c. knyv a logika alapos bemutatsn
kvl az rzeteket s cselekvseket kezel logikai gensek els rendszerezett bevezetst nyjtja.
5.2. Feladatok
8.1.
Egy logikai tudsbzis a vilgot mondatokkal reprezentlja hatrozott struktra nlkl. Egy analg (analog)
reprezentci viszont strukturlt, ahol a lers struktrja kzvetlenl megfelel a reprezentlt dolog
struktrjnak. Tekintsk egy orszg auttrkpt mint az orszgrl ismert tnyek egy rsznek analg
reprezentcijt. A trkp ktdimenzis felptse megfelel a terlet ktdimenzis felsznnek.
a. Adjon t pldt a trkpnyelv szimblumaira.
b. Explicit mondatnak nevezzk az olyan mondatot, amelyet a reprezentci ltrehozja kzvetlenl ler. Az
implicit mondatok az explicit mondatokbl keletkeznek az analg reprezentci tulajdonsgai szerint. Adjon
hrom pldt a trkpnyelv implicit s explicit mondataira.
c. Adjon az orszg fizikai struktrjt ler tnyekre hrom olyan pldt, amely nem reprezentlhat a
trkpnyelvvel.
d. Adjon kt pldt olyan tnyekre, amelyek egyszerbben kifejezhetk a trkpnyelvvel, mint az elsrend
logikval.
e. Adjon mg kt pldt analg reprezentcikra. Melyek az elnyei s a htrnyai ezeknek a nyelveknek?
8.2.
Tekintsnk egy tudsbzist, amely csak kt kijelentst tartalmaz: P(a) s P(b). Ebbl a tudsbzisbl
kvetkezik-e az x P(x)? Magyarzza meg vlaszt modellek segtsgvel.
8.3.
rvnyes-e a kvetkez mondat: x, y x = y? Magyarzza meg.
8.4.
rjon le egy olyan logikai mondatot, hogy minden olyan vilgban, ahol ez a mondat igaz, pontosan csak egy
objektum legyen.
8.5.
Tekintsnk egy szimblumsztrat, amely tartalmaz egy c konstansszimblumot, pk prediktumszimblumokat
minden egyes k rtkre s fggvnyszimblumokat minden egyes k rtkhez, ahol 1 k A. A trgyterlet
mrett rgztsk D-ben. Brmely adott interpretcimodell-kombinciban minden egyes prediktum vagy
fggvny hozz van rendelve az ugyanazon rtkhez tartoz relcihoz vagy fggvnyhez. Felttelezhetjk,
hogy a modellben szerepl fggvnyek lehetv teszik, hogy nhny bemenetnek ne legyen rtke a fggvny
szmra (vagyis, hogy az rtk a lthatatlan objektum). Vezessen le egy formult a lehetsges
interpretcimodell-kombincik szmnak megllaptsra a D elemet tartalmaz trgyterletben. Ne riassza
meg, ha el kell tvoltania a felesleges kombincikat.
8.6.
Reprezentlja a kvetkez mondatokat az elsrend logikban gy, hogy egy kvetkezetes sztrt hasznl
(amelyet elzleg definilnia kell):
240
Created by XMLmind XSL-FO Converter.
Elsrend logika
241
Created by XMLmind XSL-FO Converter.
Elsrend logika
x, s x {x s}
x, s x s y
x {y s}
8.14.
A halmazaximkat pldaknt hasznlva, ksztsen aximkat a listk trgyterletre, amelyek tartalmazzk a
korbban a fejezetben emltett sszes konstanst, fggvnyt s prediktumot.
8.15.
Magyarzza meg, hogy mi a hiba a kvetkez ajnlott definciban a szomszdos ngyzetekre a wumpus
vilgban:
x, s Szomszdos([x, y], [x + 1, y]) Szomszdos([x, y], [x, y + 1])
8.5. bra - Egy tipikus csaldfa. Az = szimblum a hzastrsakat kti ssze, a nyilak a
gyerekekre mutatnak.
8.16.
rja meg a wumpus helyzetnek meghatrozshoz szksges aximkat a Wumpus konstansszimblum s a
Be(Wumpus, Helyzet) binris prediktum felhasznlsval. Ne felejtse el, hogy csak egy wumpus van.
8.17.
Bvtse ki a 8.4. alfejezetben lert sztrt gy, hogy definilja az sszeadst az n-bites binris szmokra. Ezutn
kdolja a 8.6. brn lthat ngybites sszead lerst, s tegye fel azokat a krdseket, amelyek szksgesek
ahhoz, hogy igazoljuk sszead-helyessgt.
8.18.
A fejezetben az ramkr reprezentlsa rszletesebb a szksgesnl, ha csak az ramkr mkdse rdekel
minket. Egy egyszerbb formula brmely m bemenet, n kimenet kaput vagy ramkrt ler, egy m + n
argumentumos prediktum hasznlatval, gy, hogy a prediktum pontosan akkor igaz, amikor a bemenet s a
kimenet konzisztens. Pldul, a NOT-kapukat gy rjuk le: NOT(i, o), amelynl a NOT(0, 1)-et s a NOT(1, 0)-t
ismerjk. A kapuk sszelltsa a kapuprediktumok sszektsvel van definilva, amelyben a kzs vltozk
direkt sszekttetseket jeleznek. Pldul egy NAND ramkrt sszellthatunk AND-ekbl s NOT-okbl:
i1, i2, oa, o NAND(i1, i2, o) AND(i1, i2, o) NOT(oa, o)
Ezt a reprezentcit felhasznlva definilja a 8.4. brn lthat egybites sszeadt s a 8.6. bra ngybites
sszeadjt, s magyarzza meg, milyen lekrdezseket hasznlna, hogy igazolja a megoldsokat. Milyen fajta
lekrdezseket nem fogad el ez a reprezentci, amelyeket pedig a 8.4. alfejezetben lv reprezentci
elfogadott?
242
Created by XMLmind XSL-FO Converter.
Elsrend logika
8.19.
Krjen tlevlignyl lapot az n sajt orszgba, nevezze meg azokat a szablyokat, amelyek az ignyls
jogosultsgt meghatrozzk, s fordtsa le az elsrend logika nyelvre a 8.4. alfejezetben felvzolt lpseket
kvetve.
243
Created by XMLmind XSL-FO Converter.
Az univerzlis pldnyosts (Universal Instantiation, UI) szablya kimondja, hogy az adott vltoz brmely
alaptermmel (ground term) (vltozk nlkli termmel) val helyettestsvel elrhet mondatokat
244
Created by XMLmind XSL-FO Converter.
kikvetkeztethetjk.1 Ahhoz, hogy formlisan le tudjuk rni a kvetkeztetsi szablyokat, a 8.3. alfejezetben
bevezetett helyettests (substitution) fogalmt hasznljuk. A HELYETTEST (, ) fogja jellni annak az
eredmnyt, hogy egy behelyettestst alkalmazunk az mondathoz. Ekkor a szably gy rhat le:
brmely v vltozra s g alaptermre. Pldul a korbban megadott hrom mondatot megkaphatjuk a kvetkez
helyettestsekkel {x/Jnos}, {x/Richrd} s {x/Apj(Jnos)}.
Az ennek megfelel egzisztencilis pldnyostsi (Existential Instantiation) szably az egzisztencilis
kvantorra egy kicsivel komplikltabb. Minden mondatra, v vltozra s olyan k konstans szimblumra, amely
sehol mshol nem jelenik meg a tudsbzisban:
feltve, ha a C1 nem jelenik meg sehol mshol a tudsbzisban. Alapjban vve az egzisztencilis mondat azt
mondja ki, hogy van valamely objektum, amely eleget tesz egy felttelnek, s a pldnyosts folyamata csak
nvvel ltja el ezt az objektumot. Ez a nv viszont mr nem tartozhat ms objektumhoz. Egy szp pldt
tallunk a matematikban: ttelezzk fel, hogy tudjuk, ltezik olyan szm, amely egy kicsit kisebb, mint
2,71828, s eleget tesz annak az egyenletnek, hogy: d(xy)/dy = xy az x-re. Adhatunk nevet ennek a szmnak, mint
pldul e, de hiba lenne olyan nevet adni, amely mr egy ltez objektumhoz tartozik, mint pldul a . A
logikban ezt az j nevet Skolem-konstansnak (Skolem constant) nevezzk. Az egzisztencilis pldnyosts
egy specilis esete egy ltalnosabb folyamatnak, amelyet skolemizcinak (skolemization) neveznk, s
amelyet a 9.5. alfejezetben mutatunk be.
Amellett hogy az egzisztencilis pldnyosts bonyolultabb, mint az univerzlis pldnyosts, kiss klnbz
szerepet is jtszik a kvetkeztetsben. Mg az univerzlis pldnyostst tbbszr is alkalmazhatjuk, hogy sok
klnbz eredmnyhez jussunk, az egzisztencilis pldnyostst csak egyszer vgezhetjk el, majd az
egzisztencilis kvantorral elltott mondattl megszabadulhatunk. Pldul amint hozzadtuk a tudsbzishoz a
Meggyilkol(Gyilkos, ldozat) mondatot, mr nincs szksgnk a x Meggyilkol(x, ldozat) mondatra.
Pontosabban megfogalmazva, az j tudsbzis logikailag nem ekvivalens a rgivel, de tekinthetjk gy, hogy a
kvetkeztets szempontjbl ekvivalens (inferentially equivalent), azaz pontosan akkor kielgthet, amikor
az eredeti tudsbzis is kielgthet.
Ne keverjk ssze ezeket a helyettestseket a kiterjesztett interpretcikkal, amelyeket a kvantorok szemantikjnak a meghatrozsra
hasznltunk. A helyettests egy vltozt cserl le egy termre (egy szintaktikai elemre), hogy j mondatot hozzon ltre, ezzel szemben egy
interpretci hozzrendel egy vltozt egy objektumhoz a trgyterletben.
1
245
Created by XMLmind XSL-FO Converter.
Kirly(Jnos) (9.1)
Moh(Jnos)
Fivr(Richrd, Jnos)
Ekkor alkalmazzuk az univerzlis pldnyostst az els mondatra gy, hogy az sszes lehetsges alaptermhelyettestst felhasznljuk a tudsbzissztrbl, ami ebben az esetben az {x/Jnos} s az {x/Richrd}. gy ezt
kapjuk:
Kirly(Jnos) Moh(Jnos) Gonosz(Jnos)
Kirly(Richrd) Moh(Richrd) Gonosz(Richrd)
s megvlhatunk az univerzlis kvantorral elltott mondattl. Mrmost, a tudsbzist alapveten tletkalkulusbelinek tekinthetjk, ha az alap atomi mondatokat, mint a Kirly(Jnos), Moh(Jnos) stb., tletlogikai
szimblumoknak tekintjk. gy teht a 7. fejezetben bemutatott brmely teljes tletlogikai algoritmust
alkalmazhatjuk, hogy olyan kvetkeztetshez juthassunk, mint a Gonosz(Jnos).
Ez a technika az tletlogikai lltsokra val visszavezets (propositionalization), amelyet teljesen
ltalnoss tehetnk, mint azt a 9.5. alfejezetben be is fogjuk mutatni. Ez azt jelenti, hogy minden elsrend
tudsbzis s lekrdezs talakthat tletlogikai mondatokra gy, hogy a tudsbzis vonzatai nem vltoznak.
gy teht van egy teljes kvetkeztetsi folyamatunk vonzatok levezetsre. Vagy taln mgsem? Van egy
problma: amikor a tudsbzis tartalmaz fggvnyszimblumot, a lehetsges alaptermek helyettestseinek
halmaza vgtelen! Pldul ha a tudsbzis megemlti az Apja szimblumot, akkor vgtelen szm egymsba
gyazott termeket hozhatunk ltre, mint pldul az Apja(Apja(Apja(Jnos))). Az tletlogikai algoritmusainknak
teht nehzsgeik lesznek a vgtelen nagysg mondathalmazokkal.
Szerencsre ismert egy Jacques Herbrandnak ksznhet hres ttel az elbbi problmra (Herbrand, 1930), ami
azt mondja ki, hogy ha egy mondat kvetkezik az eredeti, elsrend tudsbzisbl, akkor ltezik olyan
bizonyts, amely csak egy vges mret rszhalmazt hasznl fel az tletkalkulus-belire talaktott
tudsbzisbl. Mivel brmely ilyen rszhalmazban az alaptermeknek van egy maximlis begyazsi mlysge,
meg lehet tallni a rszhalmazt gy, hogy elszr generljuk az sszes pldnyt a konstans szimblumokhoz
(Richrd s Jnos), azutn az sszes 1-es mlysg termet (Apja(Richrd) s Apja(Jnos)), majd az sszes 2-es
mlysg termet, s gy tovbb mindaddig, amg kpesek lesznk megalkotni a vonzatmondat tletlogikai
bizonytst.
Fontos
Felvzoltuk az elsrend kvetkeztets egy megkzeltst az tletlogikai lltsokra val
visszavezets rvn, amely teljes (complete) teht brmely kvetkezmnyknt kapott mondatot
bizonytani tudunk. Ez jelents eredmny, ha figyelembe vesszk, hogy a lehetsges modellek szma
vgtelen. Msrszt viszont nem tudhatjuk, hogy a mondat vonzat-e, amg a bizonyts nincs ksz. Mi
trtnik, ha mondat nem vonzata a TB-nek? Meg tudjuk-e ezt llaptani? Nos, ahogy ez majd kiderl,
az elsrend logika esetben erre a krdsre a vlasz nemleges. A bizonytsi eljrs tovbb
folytatdik, egyre mlyebben begyazott termeket generlva, s nem tudhatjuk, hogy a folyamat egy
vgtelen ciklusba kerl, vagy hamarosan megleljk a bizonytst. Ez nagyon hasonl a Turing gpek
lellsi problmjhoz. Alan Turing s Alonzo Church egymstl fggetlenl s eltr mdon
bizonytottk be ennek a krdsnek az eldnthetetlensgre vonatkoz ttelt (Turing, 1936; Church,
1936). Az elsrend logikban a maga utn vonzs krdse flig eldnthet (semidecidable), ami azt
jelenti, hogy ltezik olyan algoritmus, amely igent mond minden vonzatmondatra, de nem ltezik olyan
algoritmus, amely emellett kpes nemet mondani a nem levezethet mondatokra.
2. Egyests s kiemels
Az elz alfejezet bemutatta az elsrend kvetkeztetsnek azt az rtelmezst, amely az 1960-as vekig
ltezett. Az les szem olvask (s bizonyra a hatvanas vek elejnek logikval foglalkoz kutati)
szrevehettk, hogy az tletlogikai megkzelts nem nagyon hatkony. Pldul ha megnzzk a Gonosz(x)
lekrdezst s az ehhez tartoz tudsbzist a (9.1) egyenletben, feleslegesnek tnik olyan mondatok generlsa,
mint a Kirly(Richrd) Moh(Richrd) Gonosz(Richrd). Valjban a Gonosz(Jnos) mondatra vonatkoz
kvetkeztets brki szmra teljesen nyilvnval a kvetkez mondatok alapjn:
246
Created by XMLmind XSL-FO Converter.
Ebben az esetben is szeretnnk azt a kvetkeztetst levonni, hogy Gonosz(Jnos), mivel tudjuk, hogy Jnos egy
kirly (ez adott), s hogy Jnos moh (mert mindenki moh). Egy megfelel helyettests megtallsra van
szksgnk ennek elvgzshez, mind az implikcis mondatban, mind az ehhez illesztend mondatokban
tallhat vltozkra. Ebben az esetben az {x/Jnos, y/Jnos} helyettests alkalmazsa az implikci Kirly(x)
s Moh(x) premisszihoz s a Kirly(Jnos) s Moh(y) tudsbzis mondatokhoz ltrehozza az azonossgot.
gy teht ki tudjuk kvetkeztetni az implikci konklzijt.
Ez a kvetkeztets elvgezhet egyetlen kvetkeztetsi szably alkalmazsval, amelyet ltalnostott Modus
Ponensnek (Generalized Modus Ponens) neveznk: a pi, pi s q atomi mondatokra, amelyekre ltezik olyan
helyettests, hogy HELYETTEST (, pi) = HELYETTEST (, pi) minden i-re, akkor:
p1 Kirly(Jnos) p1 Kirly(x)
p2 Moh(y)
p2 Moh (x)
Knny megmutatni, hogy az ltalnostott Modus Ponens helyes kvetkeztetsi szably. Elszr is,
megfigyelhetjk, hogy brmely p mondatra (amelyeknek vltozirl felttelezzk, hogy univerzlis
kvantorokkal vannak elltva) s brmely helyettestsre:
p Helyettest(, p)
Ez hasonlan igazolhat, mint az univerzlis pldnyosts szably, s alkalmazhat olyan -ra, amely kielgti
az ltalnostott Modus Ponens szably feltteleit. gy teht, a p1,, pn -bl kvetkeztethetjk, hogy:
Helyettest(, p1) Helyettest(, pn)
Mivel a az ltalnostott Modus Ponensben gy van definilva, hogy: HELYETTEST (, pi) = HELYETTEST (,
pi) minden i-re; ebbl kifolylag a kt mondatbl az els pontosan illeszkedik a msodiknak a premisszjhoz.
gy teht a HELYETTEST (, q) kvetkezik a Modus Ponensbl.
247
Created by XMLmind XSL-FO Converter.
Az ltalnostott Modus Ponens egy kiemelt (lifted) vltozata a Modus Ponensnek temeli a Modus Ponenst
az tletlogikbl az elsrend logikba. Ltni fogjuk a fejezet ksbbi rszben, hogy kifejleszthetjk az
elrefel lncols, a htrafel lncols s a 7. fejezetben bemutatott rezolcis algoritmusok kiemelt vltozatait
is. A kiemelt kvetkeztetsi szablyok legfontosabb elnye az tletlogikra trtn talaktssal szemben az,
hogy csak azokat a helyettestseket hajtjk vgre, amelyek bizonyos kvetkeztetsek vgrehajtst teszik
lehetv. Egy potencilis korlt az, hogy egy bizonyos szempontbl az ltalnostott Modus Ponens kevsb
ltalnos, mint a Modus Ponens (lsd 4. szakasz - Az tletkalkulus kvetkeztetsi minti rszben): a Modus
Ponens brmely mondatot megenged az implikci bal oldaln, ezzel szemben az ltalnostott Modus
Ponens specilis formtumot kvn meg erre a mondatra. Csak abban az rtelemben nevezhet ltalnostottnak,
hogy tetszleges szm pi-re alkalmazhat.
2.2. Egyests
A kiemelt kvetkeztetsi szablyok olyan helyettestsek megtallst ignylik, amelyek a klnbz logikai
kifejezseket ltszlag azonoss teszik. Ezt a folyamatot egyestsi lpsnek (unification) nevezzk, ami
kulcsfontossg eleme minden elsrend kvetkeztetsi algoritmusnak. Az EGYEST algoritmus vesz kt
mondatot, s visszaad egy rjuk vonatkoz egyestst (unifier), ha ltezik ilyen:
Egyest(p, q) = , ahol Helyettest(, p) = Helyettest(, q)
Nzznk meg nhny pldt arra, hogy az EGYEST-nek hogyan kell viselkednie. Ttelezzk fel, hogy van egy
Ismer(Jnos, x) lekrdezsnk: kit ismer Jnos? Erre a krdsre nhny vlaszt gy tallhatunk, hogy
megkeressk az sszes mondatot a tudsbzisban, amely egyesthet az Ismer(Jnos, x)-szel. Itt vannak az
egyestsi eredmnyek ngy klnbz, a tudsbzisban elfordul mondatra.
Egyest(Ismer(Jnos, x), Ismer(Jnos, Jlia)) = {x/Jlia}
Egyest(Ismer(Jnos, x), Ismer(y, Lajos)) = {x/Lajos, y/Jnos}
Egyest(Ismer(Jnos, x), Ismer(y, Anyja(y))) = {y/Jnos, x/Anyja(Jnos)}
Egyest(Ismer(Jnos, x), Ismer(x, Erzsbet)) = sikertelen
Az utols egyests sikertelen, mert az x nem tudja a Jnos s az Erzsbet rtkeit egyszerre felvenni.
Emlkezznk arra, hogy az Ismer(x, Erzsbet) azt jelenti, hogy: Mindenki ismeri Erzsbetet, gy kpesnek
kellene lennnk azt kikvetkeztetni, hogy Jnos ismeri Erzsbetet. A problma abbl szrmazik, hogy a kt
mondat trtnetesen ugyanazt a vltoznevet, az x-et hasznlja. A problmt gy kerlhetjk el, hogy az
egyestend mondatokban tnevezzk a vltozkat (standardizing apart) gy, hogy elkerljk a nevek
egybeesseit. Pldul tnevezhetjk az x-et az Ismer(x, Erzsbet)-ben pldul z17-re (egy tetszleges j
vltoznvre) anlkl, hogy a jelentst megvltoztatnnk. Most mr mkdik az egyestsnk:
Egyest(Ismer(Jnos, x), Ismer(z17, Erzsbet)) = {x/Erzsbet, z17/Jnos}
248
Created by XMLmind XSL-FO Converter.
Mg egy tovbbi nehzsgen kell tljutni. Azt mondtuk, hogy az EGYEST olyan helyettestseket ad vissza,
amelyek a kt argumentumot ltszlag azonoss teszi. Azonban tbb klnbz ilyen egyests ltezhet. Pldul
az EGYEST (Ismer(Jnos, x), Ismer(y, z)) visszaadhatja azt is, hogy: {y/Jnos, x/z}, vagy azt is, hogy: {y/Jnos,
x/Jnos, z/Jnos}. Az els egyestsi lps azt eredmnyezi, hogy: Ismer(Jnos, z), ezzel szemben a msodik azt
adja, hogy: Ismer(Jnos, Jnos). A msodik eredmnyt megkaphatjuk az elsbl is egy tovbbi helyettests
hozzadsval: {z/Jnos}. Lthatjuk, hogy az els egyests ltalnosabb, mint a msodik, mert kevesebb
korltozst ad meg a vltozk rtkeire. Azt llapthatjuk meg, hogy minden egyestend kifejezsprra ltezik
egy legltalnosabb egyests (most general unifier), amely egyedi a vltozk tnevezsben. Ebben az
esetben ez: {y/Jnos, x/z}.
A legltalnosabb egyestsek kiszmtshoz a 9.1. brn lthatunk egy algoritmust. Az eljrs igen egyszer:
egy rekurzv algoritmussal egymssal prhuzamosan trjuk fel a kt kifejezst, felptve az egyestst, kivve
akkor, ha a struktrkban a kt megfelel elem nem illeszkedik. Van egy drga lps: amikor egy vltozt kell
egy komplex termhez illesztnk, meg kell vizsglni, hogy a vltoz elfordul-e a termben; ha igen, akkor az
illeszts sikertelen, mert nem tudunk konzisztens egyestst megalkotni. Ez a lps az gynevezett elfordulsi
prba (occur check), amely az algoritmus komplexitst az egyestend kifejezs mretvel ngyzetesen
nvekvv teszi. Nhny rendszer, belertve az sszes logikai programozsi rendszert, egyszeren kihagyja az
elfordulsi prbt, s ennek eredmnyeknt a kvetkeztetsk nem helyes. Ms rendszerek idben lineris
komplexits, ennl sszetettebb algoritmusokat hasznlnak.
alfejezet htralv rsze ttekinti azokat az eljrsokat, amelyekkel a visszakeresst hatkonyabb tehetjk, gy
ezt els olvassra tugorhatjuk.
A BETLT fggvnyt azzal tehetjk hatkonyabb, hogy biztostjuk, hogy az egyestsi lpst csak olyan
mondatokkal ksreljk meg, amelyeknl van egyltaln esly az egyestsre. Pldul nincs rtelme, hogy
megprbljuk az egyestst az Ismer(Jnos, x)-re s a Fivr(Richrd, Jnos)-re. Elkerlhetjk az ilyen
egyestsi lpseket, ha indexeljk (indexing) a tnyeket a tudsbzisban. Egy egyszer sma, amit
prediktum indexelsnek (predicate indexing) neveznk, beteszi az sszes Ismer tnyt egy verembe s az
sszes Fivr tnyt egy msikba. A vermek egy hash-tblban2 trolhatk, hogy hatkonyan elrhessk ket.
A prediktumok indexelse hasznos, ha sok prediktumszimblum van, de csak kevs llts az egyes
szimblumokhoz. Nhny alkalmazsban azonban sok mondat tartozik egy adott prediktumszimblumhoz.
Pldul ttelezzk fel, hogy az adhatsgok nyomon akarjk kvetni, hogy ki alkalmaz kit, s ezeket a
kapcsolatokat egy Alkalmaz(x, y) prediktum hasznlatval rjuk le. Ez egy igen nagy verem lenne, akr
munkaadk milliival s alkalmazottak tzmilliival. Egy olyan krds megvlaszolsa, mint az Alkalmaz(x,
Richrd), a prediktumok indexelsvel az egsz verem tbngszst ignyeln.
Egy ilyen lekrdezs esetben segtene, ha a tnyeket mind a prediktummal, mind a msodik argumentummal
indexelnnk, pldul gy, hogy egy kombinlt hash-tbla kulcsot hasznlunk. A kulcsot egyszeren
elllthatjuk a lekrdezsbl, s pontosan visszakereshetjk kzvetlenl azokat a tnyeket, amelyek
egyesthetk a lekrdezssel. Ms lekrdezsekhez, mint amilyen az Alkalmaz(AIMA.org, y), szksgnk van
arra, hogy a tnyeket a prediktum s az els argumentum kombinlsval indexeljk. gy aztn a tnyeket
trolhatjuk tbbszrs indexkulcsok alatt, azonnal hozzfrhetv tve minden, a tnnyel egyesthet lekrdezs
szmra.
Ha adott egy troland mondat, akkor ltre lehet hozni az indexeket az sszes lehetsges vele egyesthet
lekrdezshez. Arra a tnyre, hogy Alkalmaz(AIMA.org, Richrd), ezek a lekrdezsek:
Alkalmaz(AIMA.org, Richrd) Az AIMA.org alkalmazza Richrdot?
Alkalmaz(x, Richrd) Ki alkalmazza Richrdot?
Alkalmaz(AIMA.org, y) Kit alkalmaz az AIMA.org?
Alkalmaz(x, y) Ki alkalmaz kit?
Ezek a lekrdezsek egy bennfoglalsi hlt (subsumption lattice) alkotnak, amint az a 9.2. (a) brn lthat.
A hlnak van nhny rdekes tulajdonsga. Pldul a hl brmely csompontjnak a gyereke a szljbl egy
egyszer behelyettestssel megkaphat, s a legmagasabb kzs leszrmazottja brmely kt csompontnak a
legltalnosabb egyestjk hasznlatval rhet el. A hl rszeibl brmely alaptny szisztematikusan
ltrehozhat (9.5. feladat). Egy ismtld konstansokkal rendelkez mondatnak egy kiss ms hlja van, ezt a
9.2. (b) brn lthatjuk. A fggvnyszimblumok s a vltozk az eltroland mondatokban mg rdekesebb
hlfelptseket tesznek szksgess.
A hash-tbla informcik trolsra s visszakeressre szolgl olyan adatstruktra, amelyeket rgztett kulcsokkal indexelnk.
Gyakorlati okokbl egy hash-tblt tekinthetnk olyannak, mint amelynek a trolsi s a visszakrdezsi ideje lland, akkor is, ha a tbla
nagyon nagy szm elemet tartalmaz.
2
250
Created by XMLmind XSL-FO Converter.
A sma, amelyet lertunk, nagyon jl mkdik, amikor a hl csak kisszm csompontot tartalmaz. Egy n
argumentum prediktumra a hl O(2n) csompontot tartalmaz. Ha a fggvnyszimblumok hasznlata
megengedett, akkor a csompontok szma szintn exponencilis a troland mondat termjeinek fggvnyben.
Ez rendkvl nagy szm indexet eredmnyezhet. Egy ponton az indexels elveszti elnyeit az sszes index
trolsnak s fenntartsnak problmja miatt. Ez ellen egy rgztett stratgia bevezetsvel prblhatunk
vdekezni gy, hogy csak azokon a kulcsokon tartunk fenn indexeket, amelyek prediktumokbl s az egyes
argumentumokbl llnak. Egy msik megolds, hogy egy adaptv tervet hasznlunk, amely mindig olyan
indexeket hoz ltre, amelyek megfelelnek az aktulis lekrdezstpus ignyeinek. A legtbb MI-rendszerben a
trolni kvnt tnyek szma elg kicsi ahhoz, hogy a hatkony indexels problmjt megoldottnak tekintsk.
Az ipari s kereskedelmi adatbzisok esetben jelents technikai fejlesztsek trtntek a feladat megoldsra.
3. Elrefel lncols
Az tletlogikai hatrozott klzokra mr megadtunk egy elrefel lncolsi algoritmust a 7.5. alfejezetben. A
gondolat egyszer: kezdjk a tudsbzisban szerepl atomi mondatokkal, s alkalmazzuk a Modus Ponenst
elrefel haladva, j atomi mondatokat hozzadva, egszen addig, amg tovbbi kvetkeztetsek mr nem
vgezhetk. Most megmutatjuk, hogyan alkalmazzuk az algoritmust az elsrend hatrozott klzokra, s hogyan
valsthatjuk ezt meg hatkonyan. A hatrozott klzok, mint pldul a Helyzet Vlasz klnsen hasznosak az
olyan rendszerek szmra, amelyek jonnan rkezett informcik alapjn vgeznek kvetkeztetseket
vlaszknt. Szmos rendszert tervezhetnk ilyen mdon, s ezekben az esetekben az elrefel lncolssal
trtn kvetkeztets sokkal hatkonyabb lehet, mint a rezolcis ttelbizonyts. Ebbl az kvetkezik, hogy
gyakran rdemes megprblni olyan tudsbzist pteni, amely csak hatrozott klzokat hasznl, s gy
elkerlhetjk a rezolcival jr nehzsgeket.
Nono fel van szerelve raktkkal. Azt a mondatot, hogy x Birtokol(Nono, x) Rakta(x) talaktjuk kt
hatrozott klzz Egzisztencilis Elimincival, egy j konstans, az M1 bevezetsvel:
Birtokol(Nono, M1) (9.4)
Rakta(M1) (9.5)
251
Created by XMLmind XSL-FO Converter.
252
Created by XMLmind XSL-FO Converter.
A 9.4. bra bemutatja a generlt bizonytsi ft. Vegyk szre, hogy j kvetkeztetsek mr nem lehetsgesek
ezen a ponton, mivel minden mondatot, amelyet kikvetkeztethetnnk az elrefel lncolssal, mr explicit
mdon tartalmaz a TB. Egy ilyen tudsbzist a kvetkeztetsi folyamat fix pontjnak (fixed point) nevezzk.
Az elsrend hatrozott klzok elrefel lncolsval ltrehozott fix pontok hasonltanak az tletlogikai
elrefel lncolssal (4.2. szakasz - Elre- s htrafel lncolsrszben) generltakhoz. A leglnyegesebb
klnbsg az, hogy egy elsrend fix pont tartalmazhat univerzlis kvantorral elltott atomi mondatokat.
A ERL-EL-KRDEZ-t knny kielemezni. Elszr is megllapthat, hogy az eljrs helyes (sound), mivel
minden kvetkeztets csak az ltalnostott Modus Ponens alkalmazsa, amelyrl mr igazoltuk, hogy helyes.
Msodszor, teljes (complete) a hatrozott klzokat tartalmaz tudsbzisokra, ami azt jelenti, hogy kpes
minden olyan lekrdezst megvlaszolni, amely kvetkezik brmely hatrozott kzokbl ll tudsbzisbl. A
Datalog tudsbzisok esetre, amelyek nem tartalmaznak fggvnyszimblumokat, a teljessg bizonytsa
meglehetsen egyszer. Elszr megszmoljuk a TB-hez hozzadhat tnyeket, amely szm meghatrozza az
itercik maximlis szmt. Legyen a k ez a maximlis rtk (argumentumok szma) az adott prediktumokra, p
a prediktumok szma s n a konstansszimblumok szma. Egyrtelm, hogy nem lehet pnk klnbz
alaptnynl tbb, teht ennyi iterci utn az algoritmus el fog rni egy fix pontot. Ezutn mr az tletlogikai
253
Created by XMLmind XSL-FO Converter.
elrefel lncols bizonytsnl lertakhoz nagyon hasonlan rvelhetnk (4.2. szakasz - Elre- s htrafel
lncolsrszben.) Az tletlogikai teljes eljrs talaktst egy elsrend teljes eljrss a 9.5. alfejezetben
mutatjuk majd meg.
Fggvnyszimblumokat is tartalmaz ltalnos hatrozott klzok esetben az ERL-EL-KRDEZ vgtelen szm
j tnyt generlhat, gy ilyenkor vatosabbnak kell lennnk. Ha egy lekrdezsre adhat vlaszmondat
levezethet a TB-bl, akkor Herbrand ttelt kell alkalmaznunk, hogy biztostsuk, hogy az algoritmus megtall
egy bizonytst (lsd a 9.5. alfejezetet a rezolcis esetre). Ha a lekrdezsre nincs vlasz, akkor az algoritmus
nhny esetben nem tud lellni. Pldul ha a tudsbzis a Peano-aximkat tartalmazza,
TermSzm(0)
n TermSzm(n) TermSzm(S(n))
Ezutn meg kell tallnunk az sszes tnyt, amely egyesthet a Rakta(x)-szel. Egy megfelelen indexelt
tudsbzisban ez elvgezhet a tnyek szmval lineris idben. Vizsgljunk meg egy szablyt, mint amilyen
pldul a:
Rakta(x) Birtokol(Nono, x) Elad(West, x, Nono)
Itt is megkereshetjk a Nono ltal birtokolt sszes objektumot objektumonknt konstans id alatt. Ezutn
minden egyes objektumra meg tudjuk vizsglni, hogy az rakta-e.
Amennyiben a tudsbzis sok Nono ltal birtokolt objektumot tartalmaz s nagyon kevs raktt, akkor azonban
clszerbb lenne elszr az sszes raktt megkeresni, s aztn ellenrizni, hogy azokat Nono birtokolja-e. Ez a
konjunkt sorrendezs (conjunct ordering) problma: talljunk egy olyan sorrendet, amely a szably
premissza rsznek konjunktjait megoldja gy, hogy ezzel a teljes kltsget minimalizljuk. Megmutathat,
hogy az optimlis sorrend megtallsa nmagban is NP-nehz, de egy j heurisztika elrhet. Pldul ilyen a
legkorltozottabb vltoz (most constrained variable) heurisztikja, amelyet az 5. fejezetben a
knyszerkielgtsi problmkra hasznltunk. Ez azt a logikt kveti, hogy rendezzk sorba a konjunktokat gy,
hogy elszr a raktkat keressk, ha kevesebb rakta van, mint Nono ltal birtokolt objektum.
Fontos
A kapcsolat a mintailleszts s a knyszer kielgtse kztt valjban nagyon szoros. Brmelyik
konjunktot gy tekinthetnk, mint az ltala tartalmazott vltozk korltozst pldul, a Rakta(x)
egy unris korltozs az x-en. Ezt a gondolatot kiterjesztve, minden vges trgyterlet
knyszerkielgtsi problmt kifejezhetnk egyszeri hatrozott klzknt, nhny trstott alaptnnyel
kiegsztve. Vizsgljuk meg az 5.1. brn lthat trkpsznezsi problmt, amelyet a 9.5. (a) brn
jra bemutatunk. Egy ezzel megegyez formult adtunk meg egy hatrozott klz formjban a 9.5. (b)
254
Created by XMLmind XSL-FO Converter.
9.5. bra - (a) Ausztrlia trkpnek kisznezst bemutat knyszergrf (5.1. bra). (b)
A trkpsznez knyszerkielgtsi problma egy hatrozott klzzal reprezentlva.
Vegyk szre, hogy a vltozk trgyterlete a KL-re megadott alaptnyek konstansai
ltal implicit mdon definiltak.
Elg elkesertnek tnhet, hogy az elrefel lncols tartalmaz egy NP-nehz illesztsi problmt a bels
hurokban. Hrom mdja van annak, hogy felvidtsuk magunkat:
Emlkezhetnk arra, hogy a legtbb szably a valdi tudsbzisokban kismret s egyszer (mint a bntny
plda szablyai), s nem nagy s komplex (mint a 9.5. brn lthat knyszerproblmnl). Az adatbzisok
terletn fel szoktk ttelezni, hogy mind a szablyok mrete, mind a prediktumok argumantumszma egy
konstanssal megadhat korlt alatt marad, s gy csak az adatkomplexits (data complexity) miatt kell
aggdni vagyis a kvetkeztets komplexitsa miatt, ami az adatbzisban lv alaptnyek szmnak
fggvnye. Knny megmutatni, hogy az elrefel lncols adatkomplexitsa polinomilis.
Tekinthetjk a szablyok azon csoportjt, amelyekre az illeszts hatkony tud lenni. Alapjban vve minden
Datalog klzt tekinthetnk gy, mint ami egy knyszerkielgtsi problmt hatroz meg, gy az illeszts
kivitelezhet akkor, ha a megfelel knyszerkielgtsi problma is nyomon kvethet. Az 5. fejezet lerja a
knyszerkielgtsi problmk nhny praktikusan megoldhat csaldjt. Pldul ha a knyszergrf (egy
olyan grf, amelynek a csompontjai vltozk s az lei knyszerek) ft formz, akkor a knyszerkielgtsi
problma lineris idben megoldhat. Pontosan ugyanez a szably ll fenn a szablyillesztsre. Pldul ha
eltvoltjuk Dl-Ausztrlit a 9.5. brrl, akkor az j klz a kvetkez lesz:
Kl(nya, t) Kl(t, q) Kl(q, dw) Kl(dw, v) Sznezhet()
Fontos
255
Created by XMLmind XSL-FO Converter.
Amikor a bntny pldn bemutattuk az elrefel lncols mkdst, akkor csaltunk, nevezetesen
abban, hogy kihagytunk nhny szablyillesztst, amelyet a 9.3. brn bemutatott algoritmus elvgzett.
Pldul a msodik iterciban a:
Rakta(x) Fegyver(x)
szably s az Amerikai(West) tny kztt. Ezt a rszleges illesztst aztn kiselejtezzk, de jraptjk a msodik
ciklusban is (amikor a szably sikeres). Hatkonyabb lenne megrizni, s fokozatosan kiegszteni jabb
rszleges illesztsekkel, amikor az j tnyek berkeznek, ahelyett hogy kiselejteznnk ket.
A rete algoritmus3 volt az els, amely alaposan foglalkozott ezzel a problmval. Az algoritmus feldolgozza a
tudsbzis szablyait, hogy ltrehozzon egy adatfolyam-hlzatot, amelyben minden csompont egy literl egy
szably premissza rszbl. Vltoz lektsek ramlanak a hlzaton, megszrve azokat, amelyek nem
illeszkednek egy literlhoz. Ha egy szablyban kt literlnak ugyanaz a vltozja pldul Elad(x, y, z)
Ellensges(z) a bnz pldban , akkor a literlokhoz tartoz lektsek egy egyenlsgi csomponton
mennek keresztl. Egy vltoz lektsnek, amely elr egy csompontot egy n argumentum literlnl gy, mint
az Elad(x, y, z), vrakoznia kell, mieltt a folyamat jra kezddne, amg a tbbi vltozhoz tartoz lektseket
is ltrehozzuk. Egy adott pontban a rete hl llapota megadja a szablyok sszes, addig elvgzett rszleges
illesztseit, s gy elkerlhet a jelents jraszmols.
A rete hlk, s ms, hatkonysgot nvel fejlesztsek mindig is jelents szerepet jtszottak az gynevezett
produkcis rendszerekben (production systems), amelyek az els szles krben hasznlt elrefel lncolsi
rendszerek voltak.4 Az XCON szakrti rendszer (eredetileg R1-nek hvtk, McDermott, 1982) egy produkcis
rendszer felptst felhasznlva kszlt. Az XCON nhny ezer szablyt tartalmazott szmtgp-tartozkok
konfigurciinak megtervezsre a DEC cg vsrlinak szmra. Ez volt az egyik els igazi kereskedelmi siker
a szakrt rendszerek feltrekv piacn. Sok ms hasonl rendszer plt ugyanezt a technolgit felhasznlva,
amelyet be is ptettek egy ltalnos cl programozsi nyelvbe, az OPS-5-be.
A produkcis rendszerek a kognitv architektrkban (cognitive architectures), mint pldul az ACT
(Anderson, 1983) vagy a SOAR (Laird s trsai, 1987), is npszerek. A kognitv architektrk az emberi
gondolkods modelljei. Az ilyen rendszerekben a rendszer munkamemrija az ember rvid tv memrijt
modellezi, s a produklt kvetkezmnyek a hossz tv memria rszei. A mkds minden egyes ciklusban
a produkcikat a tnyek munkamemrijhoz illesztik. Egy olyan kvetkezmny, amelynek feltteleit kielgtik,
3
4
256
Created by XMLmind XSL-FO Converter.
A Mgikus(West) tny is hozzaddik a TB-hez. Ily mdon, mg akkor is, ha a tudsbzis amerikaiak milliirl
tartalmaz is adatokat, csak West ezredest fogjuk figyelembe venni az elrefel lncolsi folyamatban. A
mgikus halmazok definilsnak s a tudsbzis trsnak teljes folyamata tl sszetett ahhoz, hogy most itt
rszletezzk, de az alaptlet egyfajta generikus htrafel val kvetkeztets elvgzse a clbl kiindulva azrt,
hogy megtalljuk, mely vltozkapcsolatokat kell korltozni. A mgikus halmaz megkzeltst egy hibrid
algoritmusnak tekinthetjk az elrefel kvetkeztets s a htrafel halad elfeldolgoz folyamat kztt.
4. Htrafel lncols
A logikai kvetkeztetsi algoritmusoknak a msodik nagy csaldja a 7.5. alfejezetben bemutatott htrafel
lncols (backward chaining) megkzeltst hasznlja. Ezek az algoritmusok a clbl kiindulva htrafel
dolgoznak, lncszeren haladva a szablyokon keresztl, hogy megtalljk a bizonytst altmaszt mr ismert
tnyeket. Elszr bemutatjuk az alapvet algoritmust, majd lerjuk, hogyan hasznljk ezt a logikai
programozsban (logic programming), amely a legelterjedtebb formja az automatizlt kvetkeztetseknek.
Azt is ltni fogjuk, hogy a htrafel lncolsnak vannak htrnyai is az elrefel lncolssal szemben, s meg
fogjuk vizsglni, milyen mdon kerekedhetnk fell ezeken. Vgl megmutatjuk a logikai programozs s a
knyszerek kielgtsnek problmja kztti szoros kapcsolatot.
257
Created by XMLmind XSL-FO Converter.
9.7. bra - Egy htrafel lncolssal ltrehozott bizonytsi fa, annak bizonytsra,
hogy West egy bnz. A ft mlysgi keresssel kell kirtkelni, balrl jobbra. Hogy
bebizonytsuk a Bnz(West) klzt, be kell bizonytanunk az alatta elhelyezked ngy
konjunktot is. Nhnyan kzlk megtallhatk a tudsbzisban, mg msok tovbbi
htrafel lncolst ignyelnek. Mindegy egyes sikeres egyests lektseit lthatjuk a
megfelel rszcl mellett. Jegyezzk meg, hogy mihelyt egy konjunkciban egy rszcl
sikeres, helyettestseit a kvetkez rszclokhoz alkalmazzuk. gy teht, mire az ERLHL-KRDEZ eljut az utols konjunkciig, az eredetileg Ellensges(z)-ig, az mr a Nonohoz lesz lektve.
A Prolog messze a legszlesebb krben hasznlt logikai programozsi nyelv. Tbb szzezer hasznlja van.
Elssorban gyors prototpusnyelvknt hasznltk, valamint szimblummanipulcis feladatokhoz, mint pldul
fordtprogramok rsra (Van Roy, 1990) vagy termszetes nyelvek elemzsre (Pereira s Warren, 1980).
Szmos szakrtrendszert rtak Prologban jogi, orvosi, pnzgyi s ms trgyterleteken.
A Prolog programok hatrozott klzok halmazai, jellsi rendszere kiss eltr a standard elsrend logiktl. A
Prolog nagybetket hasznl a vltozkra s kisbetket a konstansokra. A klzok lersban a fej megelzi a
trzset; a :- -t hasznlja a bal oldali implikcira, vesszk vlasztjk el a literlokat a trzsben, s pont jelzi a
mondat vgt:
bnz(X):- amerikai(X), fegyver(Y), elad(X,Y,Z), ellensges(Z)
Termszetes nyelven gy olvashatak ezek a klzok, hogy (1) egy res listt hozzcsatolva az Y listhoz, egy
ugyanolyan Y listt kapunk eredmnyknt, s a (2) szerint az [A|Z] az [A|X] Y-hoz csatolsnak az eredmnye.
A csatol ezen defincija elgg hasonlnak tnik a Lispben megtallhat megfelel defincikhoz, de valjban
ez sokkal kifejezbb. Pldul feltehetjk a kvetkez krdst: csatol(A,B, [1, 2]): melyik kt listt kell csatolni
ahhoz, hogy sszelltsuk az [1, 2]-t? A programot futtatva ezeket a megoldsokat kapjuk vissza:
A = [] B = [1, 2]
A = [1] B = [2]
A = [1, 2] B = []
A Prolog-programok vgrehajtsa mlysgi keresst alkalmaz htrafel lncolson keresztl trtnik, ahol a
klzokat olyan sorrendben alkalmazzk, ahogyan a tudsbzisban szerepelnek. A Prolog nhny aspektusa a
standard logikai kvetkeztetsen kvl esik.
Beptett aritmetikai fggvnyeket tartalmaz. Az ilyen fggvnyszimblumokat hasznl literlokat a kd
vgrehajtsval bizonytja a program, s nem vgez tovbbi kvetkeztetseket. Pldul az X egyenl 4+3
akkor sikeres, ha az X rtkt a 7-hez ktjk. Ugyanakkor, az a clllts, hogy: 5 egyenl X+Y sikertelen
lesz, mert a beptett fggvnyek nem kpesek nllan egy tetszleges egyenletmegoldst elvgezni. 5
Vannak olyan beptett prediktumok, amelyeknek mellkhatsai vannak, ha vgrehajtjuk ket. Ilyenek a
bemeneti-kimeneti prediktumok s a tnyeket a TB-hez hozzad, illetve onnan trl kijelent/visszavon
prediktumok. Ezeknek a prediktumoknak nincs megfeleljk a logikban, s hatsukat sokszor nem
egyszer vgigkvetni pldul ha a tnyeket egy olyan bizonytsi fa egyik gn jelentjk ki, amely vgl
sikertelennek bizonyul.
A Prolog lehetv tesz olyan egyedi formj tagadst, amelyet sikertelensgi tagadsnak (negation as
failure) neveznk. Egy neglt cl, mint a a nem P, akkor tekintet bizonytottnak, ha a rendszernek nem
sikerl bebizonytania a P-t. gy a kvetkez mondat:
Jegyezzk meg, hogy ha a Peano-aximk meg vannak adva, akkor az ilyen clok megoldhatk egy Prolog-programon belli
kvetkeztetssel.
5
259
Created by XMLmind XSL-FO Converter.
alkalmas absztrakt utastskszlet, s interpretlhat vagy lefordthat gpi nyelvre. Ms fordtk, mint pldul a
Lisp vagy a C, egy magas szint nyelvre fordtjk le a Prologot, s ezutn hasznljk a nyelvnek a fordtjt,
hogy azt a gpi nyelvre fordtsa. Pldul, a Csatol defincijt a 9.8. brn bemutatott kdra lehet fordtani. Van
mg nhny krds, amit fontos megemlteni:
Ahelyett hogy keresglni kellene a tudsbzisban a Csatol klzokat, a klzokat eljrss lehet alaktani, s a
kvetkeztetseket egyszeren gy hajtjuk vgre, hogy meghvjuk az eljrst.
Mint azt korbban lertuk, az aktulis vltozk lektseit egy tvonalhoz rendeljk. Az eljrs els lpse
elmenti az tvonal pillanatnyi llapott gy, hogy azok visszallthatak lesznek a VISSZALLT-TVONALlal, ha az els klz sikertelen. Ez fel fog oldani minden lektst, amelyet az els EGYEST hvs generlt.
A legtrkksebb rsz a folytatsok (continuations) listjnak hasznlata a vlasztsi pontok
implementlsra. Gondolhatunk gy egy folytatsra, mint egy eljrs s egy argumentumlista
becsomagolsra, melyek egytt hatrozzk meg, hogy mit kell legkzelebb csinlni, amikor az aktulis cl
sikeres lesz. Nem elg csak gy egyszeren visszatrni egy olyan eljrsbl, mint a CSATOL, amikor a cl
sikeres, mivel itt sokfle mdon lehet sikeres az eljrs, s minden egyes esetet fel kell derteni. A folytats
argumentum megoldja ezt a problmt, mert minden egyes esetben lehvhatjuk, ha egy cl sikeres. A CSATOL
kdban, ha az els argumentum res, akkor a CSATOL prediktum sikeres. Ezutn HVJUK a folytatst, az
tvonalhoz rendelt lektsekkel, hogy vgrehajtsa, amit a folytatsban legkzelebb meg kell tenni. Pldul ha
a CSATOL hvsa a legfels szinten trtnik, a folytats kinyomtatja a vltozk lektseit.
9.8. bra - A Csatol prediktum fordtsnak pszeudokdos reprezentcija. Az JVLTOZ fggvny egy j vltozt ad vissza, amely klnbzik a korbban visszaadott
vltozktl. A HV (folytats) eljrs folytatja a vgrehajtst a megadott folytatssal.
Mieltt Warren a Prolog fordtt elksztette volna, a logikai programozs tl lass volt ltalnos cl
felhasznlshoz. A Warren s msok ltal ltrehozott fordtk lehetv tettk, hogy a Prolog kd olyan
sebessget rjen el, amelyek klnbz standard tesztek szerint is versenykpess tettk a C nyelvvel (Van
Roy, 1990). Termszetesen az a tny, hogy egy tervksztt vagy egy elemzt egy termszetes nyelvhez nhny
tucat Prolog sorban meg lehet rni, lnyegesen vonzbb teszi a Prologot a C-nl a legtbb kisebb MI-kutatsi
projekt prototpusnak az elksztsnl.
A prhuzamosts szintn jelents gyorstst eredmnyezhet. Kt elsdleges tere van a prhuzamostsnak. Az
els, amelynek neve VAGY-prhuzamossg (OR-paralellism), abbl a lehetsgbl szrmazik, hogy egy cl
szmos klnbz klzzal lehet egyesthet a tudsbzisban. Mindegyik egyests egy potencilis megoldshoz
vezet fggetlen g megjelenst eredmnyezi a keressi helyen, s minden ilyen gat prhuzamosan is
megoldhatunk. A msodik, amelynek neve S-prhuzamossg (AND-paralellism), abbl szrmazik, hogy az
implikci trzsben minden egyes konjunktot egy prhuzamos implikcival is meg lehet oldani. Az Sprhuzamossgot nehezebb megvalstani, mert a megolds az egsz konjunkcira konzisztens lektseket
ignyel az sszes vltozra. gy minden egyes konjunktv gnak kommuniklnia kell a tbbi ggal, hogy
biztostsk a globlis megoldst.
261
Created by XMLmind XSL-FO Converter.
Egy egyszer, hrom csompontos grfot, amelyet a kapcsolat(a,b) s a kapcsolat(b,c) definil, mutat be a 9.9.
(a) bra. Az tvonal(a,c) lekrdezsre a program a 9.10. (a) brn lthat bizonytsi ft generlja. Msrszt
viszont, ha a kt klzt ebbe a sorrendbe tesszk:
tvonal(X, Z):- tvonal(X, Y), kapcsolat(Y, Z)
tvonal(X, Z):- kapcsolat(X, Z)
akkor a Prolog a 9.10. (a) brn bemutatott vgtelen keresst vgzi. A Prolog teht, mint egy ttelbizonyt,
hatrozott klzokbl ll TB-re nem teljes (incomplete) (mg a Datalog programok esetben sem teljes, mint
azt a pldnk mutatja), mivel lteznek olyan tudsbzisok, amelyekben nem tud bizonytani vonzat mondatokat.
Vegyk szre, hogy az elrefel lncolssal nincs ilyen problma: ha egyszer az tvonal(a, b), az tvonal(b, c)
s az tvonal(a, c) tvonalak ki lettek kvetkeztetve, az elrefel lncols lell.
A mlysgi keressen alapul htrafel lncolsnak is akad problmja a felesleges szmtsokkal. Pldul
amikor meg akarunk tallni egy tvonalat az A1-bl a J4-be a 9.9. (b) brn, a Prolog 877 kvetkeztetst hajt
vgre, amelyek legnagyobb rszt a csompontokhoz tartoz sszes lehetsges tvonal megtallsa kpezi,
amelyekbl pedig nem lehet elrni a clt. Ez hasonl a 3. fejezetben megtrgyalt ismtelt llapot problmhoz.
A kvetkeztetsi lpsek teljes szma a generlt alaptnyek szmnak exponencilis fggvnye lehet. Ha az
elrefel lncolst alkalmazzuk ehelyett, akkor legfeljebb n2 tvonal(X, Y) tny generlhat az n csompont
sszektsvel. A 9.9. (b) brn lthat problmhoz csak 62 kvetkeztetsi lps szksges.
9.9. bra - (a) Az A-bl a C-be vezet tvonal megtallsa a Prologot egy vgtelen
hurokba vezetheti. (b) Egy grf, amelyben minden csompontot kt vletlenszer
kvetkez rtegbeli csomponthoz kapcsolunk a kvetkez rtegben. Egy tvonal
megtallsa az A1-bl a J4-be 877 kvetkeztetst ignyel.
9.10. bra - (a) Az A-bl a C-be vezet tvonal bizonytsa. (b) Vgtelen mlysg
bizonytsi fa, amely akkor generldik, ha a klzok rossz sorrendben vannak.
262
Created by XMLmind XSL-FO Converter.
Ha a Prolognak a hromszg (3, 4, 5) lekrdezst adjuk, akkor ez jl mkdik. Ha viszont azt krdezzk:
hromszg (3, 4, Z), akkor erre nem tall megoldst, mert a Z>=0 rszclt a Prolog nem tudja kezelni. A
nehzsget az okozza, hogy a Prologban a vltozknak kt llapot valamelyikben kell lennik: egy vltoz
szabad vagy egy bizonyos termhez lekttt.
Egy vltoz lektse egy termhez a korltozs egyik specilis fajtjnak tekinthet, nevezetesen egy
egyenlsgknyszernek. A korltozott logikai programozs (constraint logic programming, CLP) lehetv
teszi, hogy a vltozk korltozva legyenek, ahelyett hogy lektttek lennnek. Egy korltozott logikai program
megoldsa a korltoknak a tudsbzisbl szrmaztathat legspecifikusabb halmaza a lekrdezs vltozin.
Pldul a hromszg (3, 4, Z) lekrdezsre a megolds a 7 >= Z >= 1 knyszer. A standard logikai programok
csak a CLP specilis esetei, amelyekben a megolds knyszereinek egyenlsgi knyszereknek azaz
lektseknek kell lennik.
A CLP-rendszerek klnfle knyszermegold algoritmusokat is tartalmaznak a nyelvben megengedett
knyszerek kezelsre. Pldul egy vals rtk vltozkon rtelmezett, lineris egyenltlensgeket megenged
rendszer tartalmazhat egy lineris programozsi algoritmust ezen knyszerek feloldsra. A CLP-rendszerek egy
sokkal rugalmasabb megkzeltst is adoptlnak a standard logikai programozsi lekrdezsek megoldsra.
Pldul a mlysgi, balrl jobbra trtn visszalpses keress helyett hasznlhatjk brmelyik ennl
hatkonyabb, az 5. fejezetben trgyalt algoritmust, belertve a heurisztikus konjunktok sorba rendezst, a
visszaugrst, a vgsi halmaz kondicionlst s gy tovbb. A CLP-rendszerek teht vegyesen alkalmazzk a
knyszerekkielgtsi algoritmusok, a logikai programozs s a deduktv adatbzisok elemeit.
A CLP-rendszerek szintn hasznostjk az 5. fejezetben bemutatott klnbz knyszerprogramozsi keressi
optimalizcis mdszereket, mint a vltozk s rtkek sorba rendezst, az elrefel ellenrzst vagy az
intelligens visszalps mdszert. Szmos rendszert gy terveztek meg, hogy a programoznak nagyobb
kontrollja legyen a kvetkeztetsek keressnek a sorrendje felett. Pldul az MRS nyelv (Genesereth s Smith,
263
Created by XMLmind XSL-FO Converter.
1981; Russell, 1985) lehetv teszi a programoz szmra, hogy metaszablyokat (metarules) rjon a
konjunktok megvizsglsi sorrendjnek meghatrozsra. A felhasznl pldul rhat egy olyan szablyt, amely
azt mondja ki, hogy a legkevesebb vltozval rendelkez cl legyen elszr kiprblva, vagy rhat trgyterletspecifikus szablyokat bizonyos prediktumokhoz.
5. Rezolci
A logikai rendszerek ltalunk bemutatand hrom csaldjnak az utols tagja a rezolcin (resolution) alapul.
Lttuk a 7. fejezetben, hogy a propozcis rezolci egy cfolsteljes kvetkeztetsi folyamat az tletlogikban.
Ebben az alfejezetben meg fogjuk vizsglni, hogyan lehet kiterjeszteni a rezolcit az elsrend logikra.
A teljes bizonytsi eljrs ltezsnek krdse a matematikusokat rdekli kzvetlenl. Ha egy teljes bizonytsi
eljrs megtallhat matematikai lltsokra, ebbl kt dolog kvetkezik. Elszr is, az sszes ttel elfeltteleit
mechanikusan el tudjuk lltani; msodszor, a teljes matematika felpthet alapaximk halmaznak logikai
kvetkezmnyeknt. A teljessg krdsnek vizsglata gy a 20. szzadi matematika nhny legfontosabb
eredmnynek a megszletshez vezetett. 1930-ban Kurt Gdel nmet matematikus bebizonytotta az els
teljessgi ttelt (completeness theorem) az elsrend logikra, megmutatva, hogy minden kikvetkeztetett
mondatnak ltezik vges bizonytsa. (Gyakorlatban is felhasznlhat bizonytsi mdszert viszont nem talltak
egszen addig, amg J. A. Robinson nem publiklta a rezolcis algoritmust 1965-ben.) 1931-ben Gdel
bebizonytotta a mg hresebb nemteljessgi ttelt (incompleteness theorem). A ttel kimondja, hogy egy
logikai rendszer, amely tartalmazza az indukci elvt amely nlkl a diszkrt matematika igen kis rsze
pthet fel szksgszeren nem teljes. Ebbl az kvetkezik, hogy lteznek olyan kikvetkeztetett mondatok,
amelyeknek a rendszeren bell nincs vges bizonytsa. Lehet, hogy a t ott van a metaforikus sznakazalban,
de nincs olyan eljrs, amely garantln, hogy megtalljuk.
Gdel ttele ellenre, a rezolcialap ttelbizonytsokat szles krben alkalmaztk matematikai ttelek
levezetsre, belertve nhny olyan ttelt is, amelyre elzleg nem volt ismert bizonyts. A ttelbizonytsokat
ms alkalmazsok mellett hasznltk pldul hardvertervezs verifiklsra vagy logikailag helyes
programok generlsra.
Fontos
Minden elsrend logikai mondat talakthat a kvetkeztets szempontjbl egyenrtk CNFmondatt. Ami azt jelenti, hogy egy CNF-mondat akkor kielgthetetlen, ha az eredeti mondat is
kielgthetetlen, ezltal a CNF-mondatok kztt ellentmondsokat keresve ltre tudunk hozni
bizonytsokat.
A CNF-mondatok talaktsnak eljrsa nagyon hasonl az tletlogikai eljrshoz, amelyet a 4.1.1. szakasz Konjunktv norml formarszben lthatunk. A legfontosabb klnbsg abbl fakad, hogy ki kell vonnunk a
mondatokbl az egzisztencilis kvantorokat. Ezt az eljrst a kvetkez mondat lefordtsval illusztrljuk:
Mindenkit, aki az sszes llatot szereti, valaki szeret, vagyis:
x [y llat(y) Szereti(x, y)] [y Szereti(y, x)]
Egy klzt implikciknt is reprezentlhatunk a bal oldali atomok konjunkcijval s a jobb oldali atomok diszjunkcijval, mint azt a
7.12. feladatban lthatjuk. Ezt a formt, amelyet Kowalski-formnak (Kowalski form) szoktak nevezni, gyakran sokkal knnyebb
kiolvasni, ha az implikcik rsa jobbrl balra trtnik (Kowalski, 1979b).
6
264
Created by XMLmind XSL-FO Converter.
A lpsek a kvetkezk:
Az implikcik eliminlsa.
x [y llat(y) Szereti(x, y)] [y Szereti(y, x)]
A befel mozgatsa. A neglt sszektjelekre vonatkoz mr ismert szablyok mellett szksgnk van a
neglt kvantorokra vonatkoz szablyokra is. gy ezt kapjuk:
x p-bl lesz x p
x p-bl lesz x p
amelynek teljesen tves a jelentse: azt mondja ki, hogy mindenki vagy nem tud szeretni egy bizonyos A llatot,
vagy egy bizonyos B entits szereti t. Valjban, az eredeti mondatunk lehetv teszi minden egyes szemly
szmra, hogy ne szeressen egy msik llatot, vagy egy msik szemly szeresse t. gy teht, azt szeretnnk,
hogy a Skolem entitsok az x-tl fggjenek:
x [llat(F(x)) Szereti(x, F(x))] Szereti(G(x), x)
Az elosztsa a felett.
[llat(F(x)) Szereti(G(x), x)] [ Szereti(x, F(x)) Szereti(G(x), x)]
Ennek a lpsnek az elvgzshez szksg lehet az egymsba gyazott konjunkcik s diszjunkcik kibontsra
is.
A mondat most CNF formj, s kt klzbl ll. Elgg olvashatatlan lett. (Nmikppen segthet, ha
megmagyarzzuk, hogy az F(x) fggvny egy, az x szemly ltal potencilisan nem szeretett llatra vonatkozik,
265
Created by XMLmind XSL-FO Converter.
mg a G(x) olyan valakire utal, aki szeretheti x-et.) Szerencsre, neknk ritkn kell CNF-mondatokat
vizsglnunk a fordtsi folyamat knnyen automatizlhat.
a = {u/G(x), v/x} egyest felhasznlsval a komplemens literlokat, a Szereti(G(x), x)-t s a Szereti(u, v)-t
eliminlva kapjuk meg a rezolvens (resolvent) klzt:
[llat(F(x)) Megli(G(x), x)]
A bemutatott szably neve binris rezolcis (binary resolution) szably, mert pontosan kt literlt old fel. A
binris rezolcis szably nmagban nem eredmnyez egy teljes kvetkeztetsi folyamatot. A teljes rezolcis
szably literlok rszhalmazait rezolvlja minden egyes egyesthet klzban. Egy alternatv megkzelts a
faktorlsnak (factoring), a felesleges literlok eltvoltsnak a kiterjesztse az elsrend logikra. A
propozcis faktorls kt literlt eggy redukl, ha azok azonosak. Az elsrend faktorls kt literlt eggy
redukl, ha azok egyesthetk. Az egyestt a teljes klzra kell alkalmazni. A binris rezolci s a faktorls
kombincija mr teljes eljrst eredmnyez.
5.3. Pldabizonytsok
A rezolci a TB lltst gy igazolja, hogy bebizonytja, hogy a TB nem kielgthet, vagyis a
bizonyts az res klz szrmaztatsval trtnik. Az algoritmikus megkzelts megegyezik az tletlogikban
lvvel, amelyet a 7.12. brn mr bemutattunk, gy ezt itt most nem ismteljk meg. Ehelyett inkbb kt
pldabizonytst adunk meg. Az els a bntny plda a 9.3. alfejezetbl. A mondatok CNF-ben a kvetkezk:
Amerikai(x) Fegyver(y) Elad(x, z, y) Ellensges(z) Bnz(x)
Rakta(x) Birtokol(Nono, x) Elad(West, x, Nono)
Ellensg(x, Amerika) Ellensges(x)
Rakta(x) Fegyver(x)
Birtokol(Nono, M1) Rakta(M1)
Amerikai(West) Ellensg(Nono, Amerika)
Hozzadjuk a mondatok halmazhoz a neglt clt is Bnz(West). A rezolcis bizonytst a 9.11. bra
mutatja be. Figyeljk meg a szerkezett: a bizonytsnak egy egyszer gerince van, amely a clklzzal
kezddik, s folyamatosan rezolvl a tudsbzisbl szrmaz klzokkal, mindaddig, amg az res klzt nem
generlja. Ez jellemz a Horn-klzokat tartalmaz tudsbzisokon vgzett rezolcira. Valjban a f gerinc
mentn tallhat klzok pontosan megfelelnek a 9.6. brn lthat htrafel lncolsi algoritmusban a
clvltozk egymst kvet rtkeinek. Ez azrt van gy, mert mindig azt a klzt vlasztjuk ki rezolvlsra,
amelynek a pozitv literlja egyesthet a gerincen lv aktulis klz bal szlen elhelyezked literljval, s
pontosan ez trtnik a htrafel lncolsban is. gy teht a htrafel lncols valjban a rezolci egy specilis
esete, egy klnleges vezrlsi stratgival, amely meghatrozza, hogy melyik rezolcit hajtsuk vgre
legkzelebb.
Most pedig alkalmazzuk az talaktsi procedrt, hogy minden egyes mondatot CNF-be konvertljunk:
A1. llat(F(x)) Szereti(G(x), x)
A2. Szereti(x, F(x)) Szereti(G(x), x)
B. llat(y) Megli(x, y) Szereti(z, x)
C. llat(x) Szereti(Jank, x)
D. Megli(Jank, Tuna) Megli(Kvncsisg, Tuna)
E. Macska(Tuna)
F. Macska(x) llat(x)
G. Megli(Kvncsisg, Tuna)
267
Created by XMLmind XSL-FO Converter.
A 9.12. brn lthat a rezolcis bizonytsa annak, hogy a Kvncsisg lte meg a macskt. Magyarul a
bizonytst gy rhatjuk t:
Tegyk fel, hogy a Kvncsisg nem lte meg Tunt. Tudjuk, hogy vagy Jank, vagy a Kvncsisg tette;
teht biztosan Jank tehette. Mrmost, Tuna egy macska, s a macskk llatok, teht Tuna egy llat.
Mivel brkit, aki megl egy llatot, senki sem szeret, tudjuk, hogy Jankt nem szereti senki. Msrszt,
Jank minden llatot szeret, teht valaki szereti t, teht ez az ellentmonds ll fenn. gy teht a
Kvncsisg lte meg a macskt.
A bizonyts kpes megvlaszolni a A Kvncsisg lte meg a macskt? krdst, de gyakran ennl
ltalnosabb krdseket akarunk feltenni, mint pldul: Ki lte meg a macskt? A rezolci meg tudja
vlaszolni ezt is, de ennek a vlasznak a levezetse egy kicsit tbb munkt ignyel. A clllts a w Megli(w,
Tuna), amely neglskor CNF-ben Megli(w, Tuna) lesz. Megismtelve a bizonytst a 9.12. brn az j neglt
cllal, hasonl bizonytsi ft kapunk, de a kvetkez helyettestssel: {w/Kvncsisg} az egyik lpsben. gy
ebben az esetben, annak a kidertse, hogy ki lte meg a macskt, nem ll msbl, mint a lekrdezs vltoziban
lv lektsek nyomon kvetse a bizonytsban.
Sajnos, a rezolci csak nem konstruktv bizonytst (nonconstructive proofs) tud ellltani az
egzisztencilis clmondatokra. Pldul a Megli(w, Tuna) rezolvlhat a Megli(Jank, Tuna)
Megli(Kvncsisg, Tuna)-val, hogy a Megli(Jank, Tuna) mondatot megkapjuk, amely megint rezolvlhat
ezzel: Megli(w, Tuna), s gy kapjuk meg az res klzt. Figyeljk meg, hogy ebben a bizonytsban a w-nek
kt klnbz lektse van. A rezolci megmutatja azt, hogy igen, valaki meglte Tunt vagy Jank, vagy a
Kvncsisg. Ez nem tl meglep! Egy lehetsges megolds korltozni a rezolcis lpseket gy, hogy a
krds vltozinak csak egy lektsk lehessen egy adott bizonytsban, majd kpesnek kell lennnk arra, hogy
visszakvessk a lehetsges lektseket. Egy msik megolds egy specilis vlasz literl (answer literal)
hozzadsa a neglt clhoz, amelybl ez lesz: Megli(w, Tuna) Vlasz(w). Ilyenkor a rezolcis folyamat
mindig generl egy pontosan egy literlt tartalmaz vlaszt, amikor egy ilyan klz generldik. A 9.12. brn
lthat bizonytsra ez a Vlasz(Kvncsisg).A nem konstruktv bizonyts ezt a klzt generln:
Vlasz(Kvncsisg) Vlasz(Jank), amely nem ad szmunkra vlaszt.
9.12. bra - Egy rezolcis bizonytsa annak, hogy a Kvncsisg lte meg a macskt.
Figyeljk meg a faktorls hasznlatt a Szereti(G(Jank), Jank) klz
szrmaztatsnl.
Fontos
268
Created by XMLmind XSL-FO Converter.
Tnyknt tekintjk, hogy minden (egyenlsget nem tartalmaz) elsrend logikai mondat trhat
CNF-klzok halmazra. Ez a mondat alakjn vgzett indukcis bizonytssal igazolhat, az atomi
mondatbl, mint alapesetbl kiindulva (Davis s Putnam, 1960). Clunk teht bizonytani a kvetkezt:
ha S egy kielgthetetlen klzhalmaz, akkor az S-en elvgzett vges szm rezolcis lps alkalmazsa
ellentmondshoz vezet.
Bizonytsunk vza kveti Robinson eredeti bizonytst, nhny Geneserethtl s Nilssontl szrmaz
egyszersts hozzadsval (Genesereth s Nilsson, 1987). A 9.13. bra mutatja be a bizonyts alapvet
struktrjt, ami a kvetkez:
1. Elszr megvizsgljuk, hogy ha S kielgthetetlen, akkor ltezik S klzai kztt bizonyos alappldnyoknak
egy olyan halmaza, ami szintn kielgthetetlen. (Herbrand-ttel).
2. Ekkor az alap rezolcis ttelhez (ground resolution theorem) fordulunk, amelyet a 7. fejezetben adtunk
meg, s amely kijelenti, hogy a propozcis rezolci teljes az alapmondatokra.
3. Ezutn alkalmazzuk a kiterjesztslemmt (lifting lemma) annak megmutatsra, hogy brmely propozcis
rezolcis bizonytshoz, amely alapmondatok halmazt hasznlja, tallhat olyan elsrend rezolcis
bizonyts, amely azokat az elsrend logikai mondatokat hasznlja, amelyekbl az alapmondatokat
megkaptuk.
Az els lps elvgzshez szksgnk lesz hrom j fogalomra:
Herbrand-univerzum: Ha S a klzok egy halmaza, akkor a HS a Herbrand-univerzuma S-nek, vagyis az
sszes alaptermbl ll halmaz, amelyet ltrehozhatunk a kvetkezkbl:
a. Az S fggvny szimblumai, ha vannak ilyenek.
b. Az S konstansszimblumai, ha vannak ilyenek. Ha nincs ilyen, akkor az A konstans szimblum.
Pldul, ha az S csak a P(x, F(x, A)) Q(x, A) R(x, B) klzt tartalmazza, akkor a HS az alapmondatok
kvetkez vgtelen halmaza:
{A, B, F(A, A), F(A, B), F(B, A), F(B, B), F(A, F(A, A)), }
Teltds: Ha S a klzok egy halmaza, s P az alaptermek egy halmaza, s P(S) az S teltett halmaza P-re
vonatkoztatva, akkor P(S) az sszes alapklz halmaza, amelyet gy kapunk meg, hogy alkalmazzuk az sszes
lehetsges konzisztens helyettestst a P-beli alaptermeknek az S-beli vltozkkal.
Herbrand-bzis: Egy S klzhalmaznak a hozz tartoz Herbrand-univerzumra vonatkoz teltdst S
Herbrand-bzisnak nevezzk, s HS(S)-sel jelljk. Pldul, ha S csak a korbban pldaknt hasznlt klzt
tartalmazza, akkor a HS(S) a kvetkez vgtelen klzhalmaz :
{P(A, F(A, A)) Q(A, A) R(A, B),
269
Created by XMLmind XSL-FO Converter.
Ezek a defincik lehetv teszik, hogy a Herbrand-ttel (Herbrands theorem) egyik formjt lltsuk:
Ha a klzok egy S halmaza nem kielgthet, akkor ltezik egy vges HS(S) rszhalmaz, amely
szintn nem kielgthet.
(Herbrand, 1930)
Legyen S ez a vges rszhalmaza az alapmondatoknak. Mrmost, alkalmazhatjuk az alap rezolcis ttelt
(4.1.3. szakasz - A rezolci teljessge rszben), hogy kimutassuk, hogy a rezolcis! lezrt (resolution!
closure) RC(S) tartalmazza az res klzt. Ez azt jelenti, hogy a propozcis rezolci futtatsa a teljessgig az
S-en egy ellentmondst fog eredmnyezni.
Fontos
Gdel nemteljessg ttele
A matematikai indukcis smkkal (mathematical induction schema) kibvtve az elsrend
logikt, Gdel nemteljessg ttele (incompleteness theorem) megmutatta, hogy lteznek olyan igaz
aritmetikai mondatok, amelyek nem bizonythatk.
A nemteljessg elmlet igazolsa mintegy 30 oldalt kvnna, gy tlmutat ennek a knyvnek a keretein,
de a bizonyts lnyegt felvzoljuk a kvetkezkben. Elszr a szmok logikai elmlett vezetjk be.
Ebben az elmletben egyetlen konstans ltezik, a 0, s egyetlen fggvny, az S (az utd-fggvny). Az
gy ltrehozott modellben S(0) fejezi ki az 1-et, S(S(0)) jelli a 2-t s gy tovbb. A nyelv teht
alkalmas az sszes termszetes szm kifejezsre. A nyelv sztra tartalmazza ezenkvl a +, a s az
exp (exponencilis) fggvnyszimblumokat s a logikai sszektjelek s a kvantorok szoksos
halmazt. Elszr figyeljk meg, hogy a nyelv mondatai megszmozhatk. (Definiljunk alfabetikus
sorrendet a szimblumok kztt, s rendezzk alfabetikus sorrendbe a nyelv 1, 2, , n, hosszsg
mondatait.) gy minden mondathoz hozzrendelhetnk egy egyedi # termszetes szmot, a Gdelszmot (Gdel number). Fontos teht, hogy a szmelmlet minden sajt mondathoz tartalmaz egy
nevet. Hasonlan megszmozhatunk minden egyes P bizonytst egy G(P) Gdel-szmmal, mivel egy
bizonyts nem ms, mint mondatok vges sorozata.
Most tegyk fel, hogy adott egy A halmaz, amely a termszetes szmokrl igaz lltsokat
megfogalmaz mondatokat tartalmaz. Mivel az A halmaz megadhat egsz szmoknak egy adott
halmazval (az A halmazban tallhat mondatok Gdel-szmaival), ezrt ltre tudunk hozni a definilt
nyelvben egy (j, A) mondatot, amely a kvetkez llts:
i i nem a Gdel-szma a j Gdel-szm mondat olyan bizonytsnak, amely bizonyts csak A-beli
premisszkat hasznl.
Legyen a az (#, A) mondat, vagyis egy olyan mondat, amely kifejezi nmagnak a
bizonythatatlansgt A-bl. (Igazolhat, hogy ilyen mondat mindig ltezik, de nem egyszer ezt
beltni.)
Kvessk vgig a kvetkez gyes rvelst. Tegyk fel, hogy bizonythat A-bl, de akkor hamis,
mivel pp azt mondja ki, hogy nem igazolhat. Ebben az esetben viszont ltezik egy hamis mondat,
ami bizonythat A-bl, gy A nem tartalmazhatna csak igaz mondatokat ez az elzetes
felttelezsnkkel ellenttes. Teht nem bizonythat A-bl. Ez viszont ppen az, amit llt sajt
magrl, teht egy igaz mondat.
Teht megmutattuk (29 s fl oldalnyi levezetst tugorva), hogy brmely, a szmelmletben
definilhat igaz mondatokat tartalmaz halmaz esetben, bizonyos alapaximk felttelezse mellett,
lteznek olyan igaz mondatok, amelyek nem bizonythatk az aximkbl. Ez az eredmny, ms
kvetkezmnyek mellett azt jelenti, hogy a matematika brmely aximarendszerben
megfogalmazhat olyan ttel, amely nem bizonythat az adott rendszer aximibl. Ez a
270
Created by XMLmind XSL-FO Converter.
matematiknak egy igen fontos eredmnye. A Gdel-ttel hatst a mestersges intelligencia terletre
sokan vitattk, kztk maga Gdel is. A 26. fejezetben visszatrnk erre a krdsre.
Most, hogy megllaptottuk, hogy mindig van egy rezolcis bizonyts, amely magban foglal nhny vges
rszhalmazt a Herbrand S bzisbl, a kvetkez lps annak megmutatsa, hogy ltezik egy rezolcis
bizonyts, amely magnak az S-nek a klzait tartalmazza, amelyek nem szksgszeren alapklzok. Azzal
kezdjk, hogy megvizsgljuk a rezolcis szably egy egyszer alkalmazst. Robinson alaplemmja magba
foglalja a kvetkez tnyt:
Legyen C1 s C2 kt klz, amelyeknek nincsenek kzs vltozi. Legyenek C1 s C2 az alappldnyai C1-nek s
C2-nek. Ha C rezolvense C1-nek s C2-nek, akkor ltezik egy olyan C klz, amelyik (1) rezolvense C1-nek s
C2-nek s (2) C alappldnya C-nek.
Ezt kiterjesztslemmnak (lifting lemma) nevezik, mivel kiterjeszti a bizonytsi lpst az alap klzokrl az
ltalnos elsrend klzokra. A kiterjesztsi lemma bizonytshoz Robinsonnak szksge volt az egyests
mdszernek megalkotsra s a legltalnosabb egyest tulajdonsgainak levezetsre is. A bizonyts
ttekintse helyett a kvetkezkben illusztrljuk a lemmt:
C1 = P(x, F(x, A)) Q(x, A) R(x, B)
C2 = N(G(y), z)) P(H(y), z)
C'1 = P(H(B), F(H(B), A)) Q(H(B), A) R(H(B), B)
C'2 = N(G(B), F(H(B), A)) P(H(B), F(H(B), A))
C' = N(G(B), F(H(B), A)) Q(H(B), A) R(H(B), B)
C = N(G(y), F(H(y), A)) Q(H(y), A) R(H(y), B)
Lthat, hogy C valban C alaptermje. ltalnossgban ahhoz, hogy C1-nek s C2-nek legyen rezolvense, gy
kell ltrehozni ket, hogy elszr a C1-beli s a C2-beli komplemens literlok legltalnosabb egyestjt
alkalmazzuk C1-re s C2-re. A kiterjesztsi lemma felhasznlsval knny hasonl lltsokat levezetni a
rezolcis szably alkalmazsnak brmely sorozatra:
Brmely az S lezrshoz tartoz C klzhoz ltezik egy S lezrsban lev C klz, amelyre a C klz a C klz
alappldnya, s a C levezetse azonos hosszsg a C levezetsvel.
Ebbl a tnybl kvetkezik, hogy ha S lezrsban megjelenik az res klz, akkor ez szintn megtallhat az S
rezolcis lezrsban. Ez azrt van, mivel az res klz semmilyen ms klznak sem alappldnya.
sszefoglalva: megmutattuk, hogyha S nem kielgthet, akkor ltezik az res klznak egy vges mret
rezolcis szablyt alkalmaz levezetse.
Az elmlet bizonytsban az alapklzokrl az elsrend klzokra trtn kiterjeszts az llts erejnek igen
jelents nvelse. Ez abbl kvetkezik, hogy az elsrend bizonytsban mr csak annyiszor kell a vltozkat
helyettesteni, amennyiszer ez a bizonytshoz szksges, mg az alapklzmdszereknl szksges volt
nagyszm nknyes pldnyostst megvizsglni.
271
Created by XMLmind XSL-FO Converter.
Mikor ezek a mondatok adottak, egy standard kvetkeztetsi eljrs, mint amilyen a rezolci elvgezhet olyan
feladatokat, amelyek egyenlsgi kvetkeztetst ignyelnek, mint pldul a matematikai egyenletek megoldsa.
Az egyenlsg kezelsnek msik mdja egy tovbbi kvetkeztetsi szably alkalmazsa. A legegyszerbb
szably, a demodulci (demodulation) vesz egy egysgklzt, x = y s helyettesti az y-t brmely termmel, ami
x-szel egyesthet egy msik klzban. Formlisabban kifejezve ezt kapjuk:
Demodulci. Brmely x, y s z termekre, ahol EGYEST (x, z) = , s az mn[z] egy literl, ami tartalmazza a zt.
A demodulcit jellemzen arra hasznljk, hogy leegyszerstsen lltsok kollekciit hasznl kifejezseket,
mint pldul x + 0 = x, x1 = x s gy tovbb. A szablyt ki lehet terjeszteni, hogy olyan nem egysg klzokkal is
tudjon foglalkozni, amelyekben egy egyenlsgi literl megjelenik.
Paramodulci (paramodulation). Brmely x, y s z termre, ahol az EGYEST (x, z) =
5.6.1. Egysgpreferencia
272
Created by XMLmind XSL-FO Converter.
Ez a stratgia elnybe helyezi azoknak a mondatoknak az alkalmazst, amelyek egyetlen literlt tartalmaznak
(szoktk ezeket egysgklznak (unit clause) is nevezni). A stratgia alaptlete az, hogy prbljunk meg
ltrehozni egy res klzt, gy teht j tlet lehet elnyben rszesteni az olyan kvetkeztetseket, amelyek
rvidebb klzokat hoznak ltre. Egy egysgmondat feloldsa (mint amilyen a P) egy brmely ms mondattal
(mint amilyen a P Q R), mindig egy olyan klzt eredmnyez (ebben az esetben: Q R ), amely
rvidebb lesz, mint a msik klz. Amikor az egysgpreferencia-stratgit elszr alkalmaztk az
tletkalkulusban, akkor ez drmai gyorsulst eredmnyezett, megvalsthatv tve olyan bizonytsok
elvgzst, amelyek a preferencik meghatrozsa nlkl nem voltak kivitelezhetk. Az egysgpreferencia
azonban nmagban nem cskkenti le elgg az elgazsok szmt a kzepes mret problmkban ahhoz,
hogy ezek kezelhetk legyenek rezolcival. Mindenesetre a mdszer egy hasznos heurisztika, amit jl lehet
kombinlni ms stratgikkal.
Az egysgrezolci (unit resolution) a rezolci egy korltozott formja, amelyben minden rezolcis
lpsnek tartalmaznia kell egy egysgklzt. Az egysgrezolci ltalban nem teljes, de a Horntudsbzisokban teljes. Az egysgrezolcis bizonytsok a Horn-tudsbzisokon emlkeztetnek az elrefel
lncolsra.
5.6.4. Bennfoglals
A bennfoglals (subsumption) mdszere kizrja a keressbl azokat a mondatokat, amelyek benne foglaltatnak
(pldul mert specifikusabbak) ms tudsbzisbeli mondatokban. Pldul ha P(x) megtallhat a tudsbzisban,
akkor nincs rtelme hozzadni P(A)-t, mg kevesebb rtelme van hozzadni P(A) Q(B)-t. A bennfoglals segt
kis mreten tartani a TB-t, amely a keressi tr mretnek cskkentst eredmnyezi.
5.7. Ttelbizonytk
A ttelbizonytk (amelyeket automatizlt kvetkeztetknek is szoktunk nevezni) kt szempontbl klnbznek
a logikai programozsi nyelvektl. Elszr is a legtbb logikai programozsi nyelv csak Horn klzokkal
dolgozik, ezzel szemben a ttelbizonytsok elfogadjk a teljes elsrend logikt. Msodszor, a Prolog
programok egymsba fzik a logikt s a kontrollt. Ha a programoz vlasztsa az A:-B, C-re esik az A:-C, B
273
Created by XMLmind XSL-FO Converter.
274
Created by XMLmind XSL-FO Converter.
A felsorolt vltoztatsok ellenre a PTTP megrzi azokat a tulajdonsgokat, amelyek a Prologot gyorss teszik.
Az egyestsek mg gy is a vltozk kzvetlen vltoztatsval trtnnek gy, hogy a lektsek feloldsa a
visszalps sorn az tvonal lezrsval egytt trtnik. A keressi stratgia itt is a bemeneti rezolcin
alapszik, ami azt jeleneti, hogy minden rezolci a problma egyik eredeti kijelentsben megadott klzzal
szemben trtnik (s nem egy szrmaztatott klzzal). Ez lehetv teszi a problma eredeti kijelentsben adott
sszes klz lefordtst.
A PTTP f htrnya az, hogy a felhasznl elveszt minden vezrlsi lehetsget a megoldsok keresse sorn.
Minden kvetkeztetsi szablyt a rendszer mind az eredeti, mind a kontrapozitv formjban felhasznl. Ez
nehezen rtelmezhet keresseket eredmnyez. Pldul figyeljk meg ezt a szablyt:
(f(x, y) = f(a, b)) (x = a) (y = b)
Prolog szablyknt tekintve, ez is egy kvetkezetes mdja annak a bizonytsnak, hogy kt f term megegyezik.
De a PTTP mg a kontrapozitv lltst is generlhatja:
(x a) (f(x, y) f(a, b)) (y = b)
gy tnik, hogy ez igen fradsgos mdja annak, hogy bizonytsuk kt term, x s a klnbzsgt.
276
Created by XMLmind XSL-FO Converter.
tervt az AURA igazolta (Wojcik, 1983). A logikai kvetkeztetk, amelyeket specilisan igazolsokra terveztek,
egsz CPU-kat voltak kpesek verifiklni, belertve ezek idztsi tulajdonsgait is (Srivas s Bickford, 1990).
Az algoritmusok formlis szintzise volt a ttelbizonytsok egyik els felhasznlsa, amint azt Cordell Green
(Green, 1969a) felvzolta, aki Simon korbbi tleteire tmaszkodott (Simon, 1963). Az alaptlet az volt, hogy
egyfle mdon bizonytsk azt a ttelt, hogy ltezik egy p program, amely eleget tesz egy bizonyos
specifikcinak. Ha a bizonytst gy korltozzuk, hogy konstruktv legyen, a program maga is kinyerhet lesz
a bizonytsbl. Habr ez egy teljesen automatizlt deduktv szintzis (deductive synthesis), legalbbis gy
nevezzk, mg nemigen hasznlhat ltalnos cl programok ksztsre, m a kzzel irnytott deduktv
szintzis mr sikeresen tervezett nhny jszer s bonyolult algoritmust. A specilis cl programok szintzise
szintn aktv kutatsi terlet. Az AURA ttelbizonytt sikerrel alkalmaztk a hardverszintzis terletn olyan
ramkrk tervezsre, amelyek kompaktabbak, mint minden azt megelz terv (Wojciechowski s Wojcik,
1983). Sok ramkr tervezsnl az tletlogika elegend, mivel a legfontosabb tletlltsok halmaza rgztett,
ugyanis ezek az ramkr elemeit rjk le. Az tletlogikai kvetkeztets alkalmazsa a hardverszintzisben ma
mr egy standard technika, amelynek sok nagymret hlzati alkalmazsa ltezik (lsd pldul Nowick s
trsai, 1993).
Ugyanezeket a technikkat mostanban kezdik el alkalmazni a szoftverek verifikcijhoz is, pldul a SPIN
modell ellenrz programmal (Holzmann, 1997). A Remote Agent rhaj vezrlsi programot pldul sikerlt
verifiklni a repls eltt s utn (Havelund s trsai, 2000).
6. sszefoglals
Az elsrend logikai kvetkeztets egy elemzst mutattuk be, tovbb szmos algoritmust, melyek ilyen
kvetkeztetseket kpesek vgrehajtani.
Egy els megkzelts kvetkeztetsi szablyokat hasznl kvantorok pldnyostsra azrt, hogy talaktsa a
kvetkeztetsi problmt az tletkalkulusra. Ez a megkzelts jellemzen nagyon lass megoldsokat
eredmnyez.
A egyests hasznlata, azaz a megfelel helyettestsek megkeresse vltozkhoz, megsznteti a
pldnyosts lpst az elsrend bizonytsokban, s gy sokkal hatkonyabb teszi a folyamatot.
A Modus Ponens kiterjesztett vltozata az egyestst hasznlja, ltrehozva egy termszetes s nagy
modellez erej kvetkeztetsi szablyt, az ltalnostott Modus Ponenst (generalized Modus Ponens). Az
elrefel lncols (forward chaining) s a htrafel lncols (backward chaining) algoritmusok hatrozott
klzok halmazra alkalmazzk ezt a szablyt.
Az ltalnostott Modus Ponens teljes a hatrozott klzokra, habr a kvetkeztetsi problma flig eldnthet
(semidecidable). A Datalog programok esetben, amely programok csak fggvnymentes hatrozott
klzokat tartalmaznak, a kvetkeztets eldnthet.
Az elrefel lncolst a deduktv adatbzisokban (deductive databases) hasznljk, ahol sikeresen
kombinljk ezt a mdszert a relcis adatbzis ms mveleteivel. Ezenkvl az elrefel lncolst hasznljk
a produkcis rendszerekben (production systems) is, amelyek hatkonyan kpesek frissteni a
tudsbzisukat nagymret szablyhalmazokkal is.
Az elrefel lncols teljes a Datalog programokra, s polinomilis idben fut.
A htrafel lncolst a logikai programozsi rendszerekben (logic programming systems) hasznljk, mint
amilyen pldul a Prolog, amely kifinomult fordtsi technikkat alkalmaz, hogy biztostsa a gyors
kvetkeztetst.
A htrafel lncolsban sok a felesleges kvetkeztets, s elfordulhatnak vgtelen hurkok. Ezeket a memk
gyjtsvel (memoization) lehet kezelni.
Az ltalnostott rezolcis (resolution) kvetkeztets teljes bizonytsi rendszer az elsrend logikban. Az
eljrs konjunktv norml formj tudsbzisokat hasznl fel.
277
Created by XMLmind XSL-FO Converter.
Szmos stratgia ismert a rezolcis rendszerek keressi ternek a cskkentsre, anlkl hogy a teljessget
veszlybe sodornnk. A hatkony rezolcialap ttelbizonytsokat felhasznltk, hogy rdekes matematikai
tteleket bebizonytsanak, s hogy verifikljanak, valamint szintetizljanak szoftvereket s hardvereket.
ezen a megkzeltsen alapult. Davis s Putnam (Davis s Putnam, 1960) vezettk be a klzformt, s hoztak
ltre egy olyan programot, amely megksrelt cfolatokat tallni, oly mdon, hogy a Herbrand-univerzum
elemeit a vltozk helyre alapklzokat helyettestve s tletinkonzisztencikat keresve az alapklzok kztt.
Prawitz (Prawitz, 1960) vezette be azt az alaptletet, hogy az tletinkonzisztencia lekrdezse vezesse a
keressi folyamatot, s azt is, hogy csak akkor hozzunk ltre termeket a Herbrand-univerzumban, hogyha ez
szksges az tlet-inkonzisztencia megllaptsa cljbl. Ms kutatk egyb fejlesztsei utn, ez a gondolat
vezette el J. A. Robinsont (nem rokona az elznek) a rezolci mdszernek kifejlesztshez (Robinson,
1965). Az gynevezett inverz mdszer, amit egyidejleg fejlesztett ki S. Maslov szovjet kutat, kiss eltr
elveken alapult, mint Robinson rezolcis mdszere, de hasonl szmtsi elnyket nyjt a
propozicionalizcihoz kpest (Maslov, 1964, 1967). Wolfgang Bibel kapcsolati mdszere (connection
method) e megkzelts kiterjesztsnek tekinthet.
A rezolci kifejlesztse utn az elsrend kvetkeztetssel foglalkoz munkk klnbz irnyokban gaztak
el. Az MI-ben a rezolcit a krds-vlasz rendszerekre adoptlta Cordell Green s Bertram Raphael (Green s
Raphael, 1968). Egy kevsb formlis megkzeltst alkalmazott Carl Hewitt (Hewitt, 1969). Az PLANNER
nyelve, habr sohasem valstottk meg teljessgben, elfutra volt a logikai programozsnak, s
tmutatsokat tartalmazott az elrefel s htrafel lncolshoz, valamint a negltak sikertelensgnek vizsglati
mdszerhez. Az eredeti nyelv egy rszt, a MICRO-PLANNER-t (Sussman s Winograd, 1970) megvalstottk s
felhasznltk az SHRDLU termszetes nyelvek megrtst segt rendszerben (Winograd, 1972). A korai MIalkalmazsok jelents erfesztst tettek olyan adatstruktrk ellltsra, amelyek lehetv teszik tnyek
hatkony elhvst. Ezeket a munkkat is bemutatjk az MI-programozssal kapcsolatos cikkek (Charniak s
trsai, 1987; Norvig, 1992; Forbus s de Kleer, 1993).
A hetvenes vek elejre az elrefel lncols (forward chaining) jl megalapozottnak tekinthet az MI-ben,
egy knnyen rthet alternatvja lett a rezolcinak. Rendszerek szles krben kerlt felhasznlsra, Nevins
geometriai ttelbizonytjtl (Nevins, 1975) a VAX konfigurcijhoz hasznlt R1 szakrti rendszerig
(McDermott, 1982). Az MI-alkalmazsok jellemzen nagyszm szablyt tartalmaztak, teht fontos volt
kifejleszteni hatkony szablyillesztsi technolgit, klnsen az inkrementlis frisstsek problmjra. A
produkcis rendszerek (production systems) technolgijt azrt fejlesztettk ki, hogy segtse az ilyen tpus
az alkalmazsok megvalstst. Az OPS-5 produkcis rendszer nyelvet (Forgy, 1981; Brownston s trsai,
1985) hasznltk az R1-hez s a SOAR kognitv szerkezethez (Laird s trsai, 1987). Az OPS-5 tartalmazta a
rete illesztsi folyamatot is (Forgy, 1982). A SOAR, amely j szablyokat generl, hogy megrizze a megelz
szmtsok eredmnyeit, igen nagy szablyhalmazokat llthat el tbb mint 1 000 000 szablyt a TACAIRSOAR rendszer esetben, amely katonai replgpek szimulcijt kontrolllja (Jones s trsai, 1998). A CLIPS
(Wygant, 1989) egy C-alap produkcis rendszer nyelv, amelyet a NASA-nl fejlesztettek ki, s hatkony
integrcit tett lehetv ms programokkal, eszkzkkel s rzkel rendszerekkel, valamint felhasznltk
rjrmvek automatizlsra s egyb harcszati alkalmazsokra.
A deduktv adatbzisokknt (deductive databases) ismert kutatsi terlet szintn hozzjrult az elrefel
kvetkeztets megrtshez. Egy Toulouse-i szellemi mhelyben kezddtt a munka 1977-ben, amelyet Jack
Minker szervezett, sszehozva a logikai kvetkeztetsi s az adatbzisrendszerekkel foglalkoz szakembereket
(Gallaire s Minker, 1978). Egy trtneti ttekints (Ramakrishnan s Ullman, 1995) szerint: a deduktv
[adatbzis-] rendszerek megksrlik a Prolog adaptlst, a kis mennyisg adat megkzeltsrl a
nagymennyisg adat vilgra. gy teht, ennek a munknak a clja az, hogy egybeolvassza a relcis
adatbzis technolgit, amelyet nagymret tnyhalmazok elhvsra terveztek, a Prolog-alap kvetkeztetsi
technolgival, amely jellemzen egyszerre csak egy tnyt hv el. A deduktv adatbzisokrl szl szvegek
kz tartoznak az (Ullman, 1989) s a (Ceri s trsai, 1990) munkk.
Chandra s Harel (Chandra s Harel, 1980), valamint Ullman (Ullman, 1985) nagy hats munki a Datalognak
mint egy, a deduktv adatbzisokhoz kidolgozott standard nyelvnek az elfogadshoz vezettek. Az alulrl
felfel irny kvetkeztets, az elrefel lncols szintn standard lett rszben azrt, mert elkerli a lellsi
problmkat s a felesleges szmtsok problmjt, amely a htrafel lncolsnl elfordul, s rszben azrt,
mert termszetesebben felhasznlhat az alapvet relcis adatbzis-opercikhoz. A mgikus halmazok
(magic sets) technikja a szablyok trsra, amelyet Bancilhon (Bancilhon s trsai, 1986) fejlesztettek ki,
lehetv tette az elrefel lncolsnak, hogy a htrafel lncolstl klcsnzze a clorientltsg elnys
tulajdonsgt. A fegyverkezsi verseny kiegyenltse cljbl, a tblzatos logikai programozsi mdszerek
klcsnveszik a dinamikus programozs elnyt az elrefel lncolstl.
A logikai kvetkeztetsek komplexitsrl szerzett tudsunk legnagyobb rsze a deduktv adatbzisokkal
foglalkoz tudomnyos kzssgbl szrmazik. Chandra s Merlin (Chandra s Merlin, 1977) mutattk ki
elszr, hogy egy egyszer nem rekurzv szably (vagyis egy konjunktv lekrdezs (conjunctive query) az
279
Created by XMLmind XSL-FO Converter.
adatbzisok terminolgijban) illesztse NP-nehz lehet. Kuper s Vardi (Kuper s Vardi, 1993) javasoltk az
adatkomplexits (data complexity) hasznlatt annak a mrtknek a hasznlatt, ami a komplexitst, mint az
adatbzis mretnek egy fggvnyt mri, mikzben a szably mrett konstansnak tekinti a lekrdezsek
megvlaszolsnak mrtkre. Gottlob s trsai (Gottlob s trsai, 1999b) a konjuktv lekrdezsek s a
knyszerkielgts kztti kapcsolatot vizsgltk, megmutatva, hogy a hiper-fk lebontsa hogyan optimizlja
az illesztsi folyamatot.
Mint azt mr elzleg emltettk, a htrafel lncols (backward chaining) Hewitt PLANNER nyelvben jelent
meg a logikai kvetkeztetshez (Hewitt, 1969). A logikai kvetkeztets magtl rtetden ettl a munktl
fggetlenl fejldtt tovbb. A lineris rezolci egy korltozott vltozatt, amelyet SL-rezolcinak (SLresolution) neveznk, Kowalski s Kuehner (Kowalski s Kuehner, 1971) fejlesztette ki Loveland
modellelimincis (model elimination) technikjra ptve (Loveland, 1968). Ennek a hatrozott klzokra
alkalmazott vltozata az SLD-rezolci (SLD-resolution), amely nmagban alkalmas hatrozott klzok, mint
programok interpretlsra (Kowalski, 1974; 1979a; 1979b). Ezalatt, 1972-ben, a francia kutat, Alain
Colmerauer kifejlesztette s alkalmazni kezdte a Prologot, a termszetes nyelvek elemzsnek cljbl. A
Prolog klzait elszr kontextusmentes nyelvtani szablyoknak szntk (Roussel, 1975; Colmerauer s trsai,
1973). Az elmleti httr tlnyom rszt a logikai programozs rszre Colmerauerrel egyttmkdve
Kowalski fejlesztette ki. A szemantikai definci, amely a rgztett pontokat hasznlja, Van Emdennek s
Kowalskinak ksznhet (Van Emden s Kowalski, 1976). Kowalski (Kowalski, 1988) s Cohen (Cohen, 1988)
j trtneti ttekintst nyjtanak a Prolog eredetrl. A Logikai programozs alapjai (Foundations of Logic
Programming) (Lloyd, 1987) egy elmleti elemzse a Prolog s egyb logikai programoznyelvek
megalapozsnak.
A hatkony Prolog fordtkat ltalban a Warren Abstract Machine (WAM) szmtsi modelljre alapozzk,
amelyet David H. D. Warren (Warren, 1983) fejlesztett ki. Van Roy (Van Roy, 1990) megmutatta, hogy a
tovbbi fordtsi technikk alkalmazsa, mint amilyen a tpusinterferencia, versenykpess teszi a Prolog
programokat a C programokkal a sebessg tekintetben. A Japn tdik Genercis projekt, amely egy 1982ben kezdd 10 ves kutatsi erfeszts volt, teljes egszben a Prologon, mint az intelligens rendszerek
kifejlesztsnek alapeszkzn alapult.
A rekurzv logikai programok felesleges ciklusainak elkerlshez egymstl fggetlenl Smith (Smith s
trsai, 1986), valamint Tamaki s Sato (Tamaki s Sato, 1986) fejlesztettek ki mdszereket. Az utbbi
tanulmny tartalmazta a memk gyjtst is a logikai programokra, egy olyan mdszert, amelyet teljes
mrtkben David S. Warren fejlesztett ki a tblzatos logikai programozs (tabled logic programming)
mdszerben. Swift s Warren (Swift s Warren, 1994) bemutattk, hogy hogyan terjesszk ki a WAM-ot
tblzatok kezelsre, amely kpess tette a Datalog programokat, hogy egy nagysgrenddel gyorsabban
fussanak, mint az elrefel lncolst alkalmaz deduktv adatbzisrendszerek.
A korai elmleti munkkat a korltozott logikai programozs terletn Jaffar s Lassez vgeztk (Jaffar s
Lassez, 1987). Jaffar s trsai (Jaffar s trsai, 1992a) kifejlesztettk a CLP(R) rendszert a vals rtk
knyszerek kezelsre. Jaffar (Jaffar s trsai, 1992b) ltalnostotta a WAM-ot, ltrehozva ezzel a CLAM-ot
(Korltozott Logikai Absztrakt Gp, Constraint Logic Abstract Machine) a CLP megvalstsainak
specifiklshoz. Ait-Kaci s Podelski (Ait-Kaci s Podelski, 1993) bemutattak egy kifinomult LIFE-nak
nevezett nyelvet, amely egyesti a CLP-t a funkcionlis programozssal s az rklds kvetkeztetssel. Kohn
(Kohn, 1991) egy ambicizus projektet mutat be a korltozott logikai programozs hasznlva, a vals idej
vezrlsi architektrkat megalapozva, teljesen automata piltk alkalmazsra.
A logikai programozsrl s a Prologrl szmos knyvet rtak. A Logika a problmamegoldshoz (Logic for
Problem Solving) (Kowalski, 1979b) egy korai ltalnos tanulmny a logikai programozsrl. A Prologgal
foglalkoz knyvek kz tartoznak Clocksin s Mellish (Clocksin s Mellish, 1994), Shoham (Shoham, 1994)
s Bratko (Bratko, 2001) rsai. Marriott s Stuckey (Marriott s Stuckey, 1998) kitn lerst adjk a CLPnek. A 2000-ben trtnt megsznsig a Journal of Logic Programming volt a tma legfontosabb folyirata;
helyt mra tvette a Theory and Practice of Logic Programming. A logikai programozsok konferencii kztt
a legjelentsebbek az International Conference on Logic Programming (ICLP) s az International Logic
Programming Symposium (ILPS).
A kutatsok a matematikai ttelbizonytsok (mathematical theorem proving) terletn mr az els teljes
elsrend logikai rendszerek kifejlesztse eltt megkezddtek. Herbert Gelernter Geometriai Ttelbizonytja
(Gelernter, 1959) heurisztikai keressi mdszereket hasznlt diagramokkal kombinlva, hogy kiselejtezze a
hamis rszclokat, s kpes volt bebizonytani nhny nagyon bonyolult eredmnyt az euklideszi geometriban.
Ettl kezdve azonban nem volt jelents egyttmkds a ttelbizonyts s az MI kztt.
280
Created by XMLmind XSL-FO Converter.
6.2. Feladatok
281
Created by XMLmind XSL-FO Converter.
9.1.
Vezesse le az alapttelekbl, hogy az univerzlis pldnyosts helyes, s azt, hogy az egzisztencilis
pldnyosts kvetkeztetsi szempontbl egyenrtk tudsbzist hoz ltre.
9.2.
A Szereti( Jnos, Fagylalt) mondatbl kiindulva logikusnak tnik arra kvetkeztetni, hogy x Szereti(x,
Fagylalt). Adjon meg egy ltalnos kvetkeztetsi szablyt, az egzisztencilis bevezetst (Existential
Introduction), amely megersti ezt a kvetkeztetst. Gondosan vizsglja meg a feltteleket, amelyeket ki kell
elgteni a felhasznlt vltozkkal s termekkel.
9.3.
Ttelezzk fel, hogy egy tudsbzis csak egy mondatot tartalmaz: x OlyanMagasMint(x, Everest). A
kvetkezk kzl melyek a trvnyszer kvetkezmnyei az Egzisztencilis Pldnyosts alkalmazsnak?
a. OlyanMagasMint(Everest, Everest)
b. OlyanMagasMint(Kilimandzsr, Everest)
c. OlyanMagasMint(Kilimandzsr, Everest) OlyanMagasMint(BenNevis, Everest)
(a szably ktszeri alkalmazsa utn).
9.4.
Adja meg az albbi atomi mondatprok legltalnosabb egyestjt, ha egyltaln ltezik ilyen:
a. P(A, B, B), P(x, y, z)
b. Q(y, G(A, B)), Q(G(x, x), y)
c. Idsebb(Apja(y), y), Idsebb(Apja(x), Jnos)
d. Ismeri(Apja(y), y), Ismeri(x, x)
9.5.
Figyelje meg a 9.2. brn bemutatott bennfoglalsi rcsokat.
a. Hozza ltre a rcsot a kvetkez mondatra: Alkalmaz(Anyja(Jnos), Apja(Richrd)).
b. Hozza ltre a rcsot a kvetkez mondatra: Alkalmaz(IBM, y) (Mindenki az IBM-nl dolgozik). Figyeljen
arra, hogy minden olyan lekrdezst felsoroljon, amely egyesthet a mondattal.
c. Ttelezzk fel, hogy a TROL indexel minden egyes mondatot, minden egyes csompontra a bennfoglalsi
rcsban. Magyarzza meg, hogy a BETLT eljrsnak hogyan kell mkdnie, amikor nhny mondat ezek
kzl vltozkat is tartalmaz; pldaknt hasznlja a mondatokat az (a) s (b) rszfeladatokbl, s a kvetkez
lekrdezst: Alkalmaz(x, Apja(x)).
9.6.
Ttelezzk fel, hogy betltjk egy logikai adatbzisba az amerikai vlasztsi cmjegyzket, amely felsorolja a
kort, a lakhelyt, a szletsi dtumt s az anyja nevt minden szemlynek, trsadalombiztostsi szmokat
hasznlva azonost adatknt. gy teht Gyrgy kora gy van megadva: Kora(443-65-1282, 56). A kvetkez
S1S5 indexel smk melyike tesz lehetv hatkony megoldst a Q1Q4 lekrdezsekre (tekintsnk egy
norml htrafel lncolst)?
S1: egy index minden egyes atomra minden egyes pozciban.
S2: egy index minden egyes els argumentumra.
282
Created by XMLmind XSL-FO Converter.
9.12.
Kvesse nyomon a 9.6. brn lthat htrafel lncolsi algoritmus vgrehajtst, amikor azt a bntny
problma megoldsra alkalmazzuk. Mutassa be azt az rtk-szekvencit, amelyet a clok vltoz vesz fel, s
rendezze egy fa formba.
9.13.
A kvetkez Prolog kd egy P prediktumot hatroz meg:
P(X,[X Y])
P(X,[Y Z]):-P(X,Z)
284
Created by XMLmind XSL-FO Converter.
meg. Valsznleg a mlysgi keress a legknnyebb mdja annak, hogy ezt vgrehajtsa. Mennyire lenne
knny egy heurisztikus keressi vezrls hozzadsa?
9.17.
Hogyan alkalmazhat a rezolci annak megmutatsra, hogy egy mondat
a. rvnyes-e?
b. kielgthetetlen-e?
9.18.
Abbl a mondatbl, hogy a lovak llatok kvetkezik-e, hogy egy l feje egy llat feje. Demonstrlja, hogy
ez a kvetkeztets rvnyes, ha vgrehajtjuk a kvetkez lpseket:
a. Fordtsa le a premisszt s a kvetkezmnyt az elsrend logika nyelvre. Hasznljon hrom prediktumot:
Feje(h, x), L(x) s llat(x)!
b. Neglja a kvetkezmnyt, s konvertlja a premisszt s a neglt kvetkezmnyt konjunktv norml formra!
c. Mutassa meg a rezolci felhasznlsval, hogy a kvetkezmny valban kvetkezik a premisszbl!
9.19.
Tekintsk a kvetkez kt elsrend logikai mondatot:
(A): x y (x y)
(B): y x (x y)
285
Created by XMLmind XSL-FO Converter.
1. Ontolgiaszervezs
Jtk trgyterleteken a reprezentci megvlasztsa nem annyira lnyeges. Knny egy konzisztens
fogalomkszletet kialaktani. Az olyan komplex terleteken azonban, mint pldul az interneten trtn
bevsrls vagy egy robot vezrlse vltoz fizikai krnyezetben, ltalnosabb s rugalmasabb reprezentcira
van szksg. Ebben a fejezetben megmutatjuk, hogy ilyen reprezentcikat hogyan lehet ltesteni, olyan
ltalnos fogalmakra fkuszlva, mint a Cselekvs, az Id, a FizikaiObjektum s a Hiedelem, amelyek szmos
trgyterleten fordulnak el. Ezen absztrakt fogalmak reprezentlst nha ontolgiaszervezsnek (ontological
engineering) nevezik. Az ontolgiaszervezs kapcsolatban ll a 8.4. alfejezetben lert tudsszervezs
folyamatval, de a hatsa szlesebb kr.
A vilgrl mindent reprezentlni ijeszt perspektva. Valjban termszetesen nem fogjuk mindennek a
komplex lerst megadni ez mg egy 1000 oldalas knyvnek is sok lenne , de megjelljk vilgosan annak a
helyt, ahova egy tetszleges terletrl szl j tuds beilleszthet. gy pldul definilni fogjuk, hogy mit is
jelent fizikai objektumnak lenni, s a klnbz objektumok rszletei robotok, tv-kszlkek, knyvek vagy
brmi ms ksbb illeszthetk ebbe a keretbe. A fogalmak egy ltalnos kerett fels ontolginak (upper
ontology) nevezzk, mert az az ltalnos konvenci, hogy a grfszer brzolsnl az ltalnosabb fogalmak
fell helyezkednek el, a konkrtabb fogalmak pedig alul (lsd 10.1. bra).
Mieltt az ontolgit tovbb tekintennk, egy fontos figyelmeztetst kell tennnk. A tuds tartalmnak s
szervezsnek a megvitatsra elsrend logikt vlasztottunk. A valdi vilg bizonyos aspektusait ezen a
nyelven nehz lesz kifejezni. Egy alapvet tulajdonsgot knytelenek lesznk kihagyni: azt, hogy minden
ltalnosts all lteznek kivtelek, vagy hogy a rszletesebb informci hinyban csupn az alaprtelmezst
tekinthetjk, vagy pedig hogy minden ltalnosts csak egy bizonyos mrtkig rvnyes. Br a paradicsom
piros hasznos szably, van zld, srga s narancssrga paradicsom is. Hasonl kivteleket ebben a
rszfejezetben majdnem mindegyik llts esetn lehet tallni. A kivtelek s a bizonytalansg kezelse nagyon
fontos kpessgek, azonban egy ltalnos ontolgia megrtshez viszonytva ortogonlisak. Ezrt a kivtelek
s az alaprtelmezs megvitatst a 10.6. alfejezetre, a bizonytalan informci sokkal ltalnosabb tmjt pedig
a 13. fejezetre hagyjuk.
Milyen haszna van egy fels ontolginak? Gondoljunk vissza a 8.4. alfejezet ramkri ontolgijra.
Megkonstrulsnl igen sok egyszerst felttelezssel ltnk. gy pldul az idt teljes egszben ki is
hagytuk. A jelek rgztettek voltak, s a jeltovbbterjedsrl nem is esett sz. Az ramkrk struktrja
vltozatlan maradt. Az ltalnossg fel gy tudnnk lpni, hogy a jeleket konkrt idpillanatokban definilnnk
s foglalkoznnk a vezetkek hosszval, valamint a vezetkekben s a berendezsekben fellp jelterjedsi
ksleltetsekkel. Ezzel szimullni tudnnk az ramkr idztsi tulajdonsgait; s valban az ramkrtervezk
gyakran folyamodnak is az ilyen elemzshez. A kapuk rdekesebb osztlyait is be lehetne vezetni, pldul lerva
a technolgit (TTL, MOS, CMOS stb.) s a bemeneti/kimeneti specifikcikat is. Ha a megbzhatsggal vagy
diagnzissal szeretnnk foglalkozni, engedlyezni kellene, hogy az ramkr struktrja spontn mdon
megvltozhasson. A szrt kapacitsok figyelembevtelhez a tisztn topolgiai reprezentcival fel kellene
hagyni, s t kellene trni a geometriai tulajdonsgok valsghbb lersra.
286
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
Hasonl megfontolsok rvnyesek, ha a wumpus vilgt nzzk. Br foglalkozunk az idvel, ennek struktrja
igen egyszer. A dolgok csak az gens cselekvsvel egy idben trtnnek, s minden vltozs azonnali jelleg.
Egy ltalnosabb, a valdi vilghoz jobban illeszked ontolgia engedlyezn pldul, hogy az egyidej
vltozsoknak legyen idbeli kiterjedsk. Arra, hogy egy konkrt ngyzetben csapda van, a Csapda konstanst
hasznltuk, mert minden csapda azonos volt. Engedlyezni lehetne a csapdk tbb fajtjt is, a csapdk
osztlyhoz tartoz, eltr tulajdonsg pldnyokat hasznlva. Hasonl mdon tbb llatfajtt is be tudnnk
vezetni a wumpuson kvl. Elkpzelhet, hogy a rendelkezsre ll rzkelsekbl az llat konkrt fajtjt
nehz lenne megllaptani. Az gens megsegtsre a wumpus vilg biolgiai taxonmijt fel lehetne lltani,
hogy gyenge nyomravezet jelekbl kpes legyen megjsolni az llat viselkedst.
Az ilyen mdostsok rvn minden specilis rendeltets ontolgiban lehetsges egy nagyobb ltalnossg
fel elmozdulni. A nyilvnval krds ilyenkor az, hogy konverglnak-e ezek a mdostsok egy ltalnos cl
ontolgihoz? vszzadokon t foly filozfiai s szmtsi kutatsok utn a vlasz az, hogy lehetsges.
Ebben a fejezetben egy lehetsges vltozatot mutatunk be, amely az vszzadok sorn szletett gondolatok
szintetizlst kpviseli. Az ltalnos cl ontolginak kt olyan f jellemzje van, ami azt a specilis
rendeltets ontolgik sokasgtl megklnbzteti:
Az ltalnos ontolgit (a trgytartomnyra vonatkoz aximk hozzadsval) tbb-kevsb minden
specilis rendeltets trgytartomnyban kell tudnunk alkalmazni. Lehetsg szerint teht egyetlen
reprezentcis problmval sem lehet ravaszkodni vagy azt a sznyeg al sprni.
Minden kellen ignyes trgytartomnyban a tuds egyes rszeit egyesteni kell, hiszen a kvetkeztets s a
problmamegolds egyszerre tbb terletet is ignyelhet. Egy robot ramkrjavt rendszer esetn pldul az
ramkrkrl a villamos sszekttetsek s a fizikai elrendezs szempontjbl kell tudnunk kvetkeztetni, de
az id az ramkr-idztsi analzis s a munkakltsgek szempontjbl egyarnt lnyeges. Az idt ler
lltsokat teht ssze kell tudnunk kombinlni a fizikai elrendezst ler lltsokkal, s ezeknek az
lltsoknak egyformn jl kell mkdnik nanomsodpercekre s percekre is, valamint nanomterekre s
mterekre is.
Miutn az ltalnos ontolgit megalkottuk, felhasznljuk az internetes bevsrls trgytartomnyra. Ez a
trgytartomny tbb mint alkalmas arra, hogy az ontolginkkal ksrletezznk. Sok helyet hagy az olvas
rszre is, hogy a reprezentciba a sajt kreativitst is bevihesse. Gondoljunk pldul arra, hogy egy
interneten bevsrl gensnek rengeteg tmt s szerzt kell ismernie, hogy az Amazon.com-tl knyveket
vsroljon, lelmiszerek egsz vlasztkrl kell tudnia, hogy a Peapod.com-nl lelmiszert vsroljon, s
mindenrl, amit egy bolhapiacon tallni lehet ismeretekkel kell rendelkeznie, hogy az Ebay.com1-nl az alkalmi
j zletekre vadsszon.
Az olvas elnzst krjk, ha rajtunk kvl es okok miatt ezen online boltok valamelyike a knyv olvassnak pillanatban mr nem
mkdik.
1
287
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
2. Kategrik s objektumok
Fontos
Az objektumok kategrikba (categories) val szervezse a tudsreprezentci szempontjbl
ltfontossg. Br a vilggal val klcsnhats az egyedi objektumok szintjn trtnik, a
kvetkeztetsek zme a kategrik szintjn valsul meg. A bevsrl clja egy kosrlabda megvsrlsa
s nem egy konkrt kosrlabdapldnynak, mondjuk KL9-nek a megvtele. Ha az objektumok
osztlyozst elvgeztk, kategrik segtsgvel megjsolhatjuk az objektumok tulajdonsgait.
rzkel jelek alapjn kvetkeztetnk bizonyos objektumok jelenltre, az rzkelt tulajdonsgokbl
kvetkeztetnk, hogy az objektumok milyen kategrikhoz tartoznak, majd a kategrikra vonatkoz
ismereteket felhasznlhatjuk, hogy az objektumokra vonatkozan elrejelzseket hozzunk. gy pldul
a zld, foltos fellet, a tekintlyes nagysg s az ovlis vagy gmbszer alak alapjn grgdinnyre
kvetkeztethetnk; a grgdinnyre vonatkoz ismereteink alapjn pedig arra, hogy az felhasznlhat
lenne gymlcssalta ksztshez.
Az elsrend logikban a kategrik reprezentlsra kt alapvet vlasztsunk lehet: a prediktumok s az
objektumok. Hasznlhatunk egy KosrLabda(l) prediktumszimblumot, vagy a kategrit KosrLabda
objektumknt reifiklhatjuk (reification). Mondhatjuk akkor, hogy Eleme(l, KosrLabda) (rvidtve l
KosrLabda) annak a kifejezsre, hogy l a kosrlabda-kategria eleme. Azt mondjuk, hogy
Rszhalmaza(KosrLabda, Labda) (rvidtve KosrLabda Labda) annak a kifejezsre, hogy a KosrLabda a
Labda egy alkategrija vagy rszhalmaza. Egy kategrit tekinthetnk az elemeibl ll halmaznak, de egy
sokkal bonyolultabb objektumnak is kpzelhetjk, olyannak, amire az Eleme s a Rszhalmaza relcik
definiltak.
A kategrik rklds (inheritance) rvn szolgljk a tudsbzis szervezst s egyszerstst. Ha
kijelentjk, hogy az lelem kategria minden egyes pldnya ehet, s felttelezzk, hogy a Gymlcs lelem,
az Alma viszont a Gymlcs kategria egy alosztlya, akkor tudjuk, hogy minden alma ehet. Azt mondjuk,
hogy az egyes almk az ehetsgi tulajdonsgukat rkltk (inherit), jelen esetben az lelem kategrihoz
val tartozs rvn.
Az alosztly-relcik a kategrikat taxonmiba vagy taxonomikus hierarchiba (taxonomy, taxonomic
hierarchy) szervezik. A taxonmikat tudomnyos terleteken vszzadok ta alkalmaztk. gy pldul a
rendszerez biolgia az sszes l s kihalt faj taxonmijt igyekszik megadni, a knyvtrtudomny az sszes
tudomnyos terletet tfog taxonmijt a Dewey Decimlis rendszert alaktotta ki, az adhatsgok s
ms kormnyzati szervek a foglalkozsok s termkek kiterjedt taxonmijt hoztk ltre. A taxonmik
ahogy a tovbbi elemzseinkben ltni fogjuk fontos aspektusai a jzan sz tudsnak is.
A kategrikrl az elsrend logikban knny lltsokat megfogalmazni az objektumok s a kategrik
egymshoz val rendelsvel vagy a kategrihoz tartoz egyedek szerinti kvantifikls rvn:
Egy objektum egy kategria egyede, pldul:
KL9 KosrLabda
Egy kategria egyedeit bizonyos tulajdonsgaik alapjn fel lehet ismerni, pldul:
Narancsszin(x) Gmbly(x) tmr(x) = 24 x Labda x KosrLabda
288
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
Jegyezzk meg, hogy mivel a Kutya egy kategria s a HonostottFajta kategrinak egy egyede, gy a
HonostottFajta a kategrik kategrija. A kategrik kategriinak a kategriirl is lehetne beszlni, de
ennek kevs a haszna.
Br az alosztly- s az egyedrelcik a kategrik szempontjbl a legfontosabbak, olyan kategrik kztti
relcikat is ki szeretnnk fejezni, amelyek egymsnak nem alosztlyai. Ha pldul azt mondjuk, hogy a Hm s
a Nstny az llat alosztlyai, ezzel nem mondtuk azt, hogy egy hm nem lehet nstny. Azt mondjuk, hogy kt
vagy tbb kategria diszjunkt (disjoint), ha kzs egyedei nincsenek. Ha tudjuk azt is, hogy a hmek s a
nstnyek klcsnsen kizrjk egymst, attl mg nem tudjuk, hogy egy llatnak, amely nem hm, nstnynek
kell lennie, hacsak nem mondjuk ki, hogy a hmek s a nstnyek az llatok kimert felosztst (exhaustive
decomposition) kpezik. A diszjunkt kimert feloszts a partci (partition). Ezt a hrom fogalmat az albbi
pldk illusztrljk:
Diszjunkt({llat, Zldsg})
KimertFeloszts({Amerikai, Kanadai, Mexiki}, szakAmerikai)
Partci({Hm, Nstny}, llat)
(Jegyezzk meg, hogy az szakAmerikai KimertFeloszts-a nem Partci, mert vannak ketts
llampolgrsg szemlyek is.) E hrom prediktum defincija az albbi:
Diszjunkt(s) (c1, c2 c1 s c2 s c1 c2 Metszet(c1, c2) = { })
KimertFeloszts(s, c) (i i c c2 c2 s i c2)
Partci(s, c) Diszjunkt(s) KimertFeloszts(s, c)
Kategrikat gy is definilhatunk, hogy megadjuk a tagsguk elgsges s szksges feltteleit. Pldul egy
agglegny egy felntt, nem hzas frfi:
x Agglegny NemHzas(x) x Felntt x Frfi
Ahogy errl a termszetes fajtkrl szl rvid kitrben sz lesz, a kategrik szigor logikai defincija nem
mindig lehetsges, s nem is mindig szksges.
289
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
Rsze(b, a) Rgztett(l1, b) Rgztett(l2, b) l1 l2
[l3 Lb(l3) Rsze(l3, a) (l3 = l1 l3 = l2)
A pontosan kett jells egy kicsit fura. Knytelenek vagyunk kijelenteni, hogy kt lb van, s ezek nem
azonosak, s ha valaki egy harmadik lbbal jn el, annak azonosnak kell lennie a kett valamelyikvel. A 10.6.
alfejezetben ltni fogjuk, hogy a ler logiknak nevezett formalizmus a pontosan kett tpus korltozsokat
egyszerbben fejezi ki.
A kategrikra vonatkoz Partci relci mintjra egy RszPartci relcit definilhatunk (lsd 10.6.
feladat). Egy objektum a RszPartci-jban felsorolt rszeibl ll, s bizonyos tulajdonsgaira ezekbl a
rszekbl lehet kvetkeztetni. gy pldul egy sszetett objektum tmege a rszeihez tartoz tmegek sszege.
Jegyezzk meg, hogy ez a kategrikra nem vonatkozik: egy kategrinak nincs tmege annak ellenre, hogy az
elemeinek lehet tmege.
Hasznos olyan sszetett objektumokat is definilni, amelyeknek meghatrozott rszei vannak, de konkrt
struktrjuk nincsen. Elfordulhat, hogy azt szeretnnk mondani, hogy: A zacskban 3 kg alma van. Ksrtst
rezhetnnk, hogy a zacskban-alma halmazhoz slyt rendeljk, ez azonban hiba lenne, mert egy halmaz
absztrakt matematikai fogalom, aminek vannak elemei, de slya nincs. Ahelyett egy j fogalomra van
szksgnk, amit ktegnek (bunch) fogunk nevezni. Ha az almk pldul az Alma1, az Alma2 s az Alma3, akkor
a:
Kteg({Alma1, Alma2, Alma3})
a hrom almbl (mint rszbl, de nem mint elembl) ll sszetett objektumot jelli. A kteget egy
kznsges, br nem strukturlt objektumknt hasznlhatjuk. Jegyezzk meg, hogy Kteg({x}) = x.Tovbb,
hogy a Kteg(Alma) az sszes almbl ll sszetett objektum, amit az Alma kategrival sszetveszteni nem
szabad.
A Kteg-et a Rsze relcival tudjuk definilni. Az s minden eleme, eleme a Kteg({s})-nek is:
x
x s Rsze(x, Kteg(s))
Tovbb, a Kteg(s) a legkisebb objektum, amely ezt a felttelt teljesti. Ms szval a Kteg(s) rsznek kell
lennie minden olyan objektumnak, amely az s sszes elemt rszeknt tartalmazza:
y [x x s Rsze(x, y)] Rsze(Kteg(s), y)
Ezek az aximk a logikai minimalizlsnak (logical minimization) nevezett ltalnos mdszer egy pldjt
jelentik. A logikai minimalizls azt jelenti, hogy egy objektumot bizonyos feltteleket kielgt legkisebb
objektumnak definilunk.
2.2. Mrtkek
A vilgnak mind a tudomnyos, mind a jzan sz elmleteiben az objektumoknak magassga, tmege, ra van
s gy tovbb. Az ezekhez a tulajdonsgokhoz elrt rtkek a mrtkek (measures). Kznsges, kvantitatv
mrtkeket knny reprezentlni. Kpzeljk el, hogy az univerzum absztrakt mrtkobjektumokat tartalmaz,
mint pldul a hossz, ami az itt lthat vonalszegmens hossza:
Nevezhetjk ezt a hosszat 1,5 hvelyknek vagy 3,81 cm-nek. Ugyanannak a hossznak teht a nyelvnkben tbb,
klnbz neve is lehet. Logikailag ez gy lehetsges, hogy egy egysgfggvnyt (unit function) egy szmmal
kombinlunk. (Egy alternatv smval a 10.8. feladatban foglalkozunk.) Ha L1 a vonalszegmens neve, akkor azt
rhatjuk, hogy:
Hossz(L1) = Hvelyk(1,5) = Centimter(3,81)
Az egysgek kztti konverzit olyan lltsokkal lehet megoldani, amelyek az egyik egysg tbbszrst a
msik egysggel teszik azonoss:
Centimter(2,54 l) = Hvelyk(l)
290
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
Jegyezzk meg, hogy a $(1) nem egy egydollros bank! Az egydollros bankbl lehet kett, de a $(1) nev
objektumbl csak egy van. Jegyezzk meg azt is, hogy mg a Hvelyk(0) s Centimter(0) ugyanarra a
zrushosszra hivatkozik, ms zrusmrtkekkel, mint pldul a Msodperc(0) nem azonosak.
Egyszer, kvantitatv mrtkeket reprezentlni knny. Ms mrtkek tbb problmt okoznak, mert nincs
hozzjuk elfogadott rtkskla. A gyakorlat nehz, a desszert finom s a vers szp, azonban e kvalitsokhoz
nehz szmokat rendelni. Valaki megksrelhetn az ilyen tulajdonsgokat teljesen elutastani, mint olyanokat,
melyeknek a logikai kvetkeztets szempontjbl nincs hasznuk, vagy ami mg rosszabb megksrelhetne a
szpsgre egy numerikus sklt rknyszerteni. Ez slyos hiba lenne, mert ilyen lpsre nincs is szksg. A
mrtkek legfontosabb tulajdonsga nem az, hogy valamilyen konkrt numerikus rtkkel rendelkeznek, hanem,
hogy rendezettek.
Annak ellenre, hogy a mrtkek nem szmok, sszehasonltsukra a > rendez szimblumot fogjuk hasznlni.
gy pldul hihetjk azt, hogy a Norvig rta feladatok nehezebbek, mint azok, amiket Russell rt, s hogy egy
nehezebb feladatnl kevesebb pontot lehet elrni:
e1 Feladatok e2 Feladatok rta(Norvig, e1) rta(Russell, e1)
Nehzsg(e1) > Nehzsg(e2)
e1 Feladatok e2 Feladatok Nehzsg(e1) Nehzsg(e2)
VrhatEredmny(e1) < VrhatEredmny(e2)
Ez elg is ahhoz, hogy valaki eldnthesse, melyik feladattal rdemes foglalkoznia, brmennyire nem
hasznltunk semmifle numerikus rtket a nehzsg kifejezsre. (Azrt azt meg kell tudnunk llaptani, hogy
melyik feladatot ki rta.) A mrtkek kztti effle monoton relci az alapja a kvalitatv fizika (qualitative
physics) terletnek. Ez az MI egy rszterlete, amely azt vizsglja, hogy hogyan lehetne a fizikai rendszerekre
kvetkeztetni anlkl, hogy a rszletes egyenletekbe s a numerikus szimulcikba belebonyoldnnk. A
kvalitatv fizikval a trtneti megjegyzsekben foglalkozunk.
Fontos
Termszetes fajtk
Egyes kategriknak szigor defincii vannak. Egy objektum akkor s csak akkor hromszg, ha egy
hromoldal sokszg. A valdi vilgban viszont a kategrik tbbsge termszetes fajtj (natural
kind) anlkl, hogy brmilyen letisztult defincija lenne. Tudjuk pldul, hogy a paradicsomok
mlyvrs sznek s nagyjbl gmbszerek szoktak lenni, a tetejkn, ahol a szruk csatlakozott,
egy kis bemlyedssel rendelkeznek, nagyjbl 58 cm tmrjek, s vkony, de ers brrel, bell
hssal, magvakkal s lvel rendelkeznek. Azt is tudjuk azonban, hogy eltrsek is vannak. Egyes
paradicsomok narancssznek, az retlen paradicsom zld, egyesek kisebbek, illetve nagyobbak, mint
az tlag, a miniparadicsomok egysgesen kismretek. Ahelyett hogy a paradicsomok tkletes
defincijra trekednnk, inkbb egy tulajdonsghalmazzal rendelkeznk, amely arra szolgl, hogy
azonostsunk bizonyos objektumokat, amelyek nyilvnvalan tipikus paradicsomok, ms objektumok
esetn azonban lehet, hogy a felismers csdt mond. (Lehet egy paradicsom szrs, mint egy
szibarack?)
Egy logikai gens rszre ez problmt jelent. Az gens nem lehet biztos abban, hogy az ltala rzkelt
objektum valban egy paradicsom, s ha mgis biztos lenne benne, nem tudn eldnteni, hogy a tipikus
paradicsom tulajdonsgai kzl az rzkelt objektum melyekkel rendelkezik. Ez a problma egyenes
kvetkezmnye annak, hogy az gens egy hozzfrhetetlen krnyezetben mkdik.
291
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
Egy hasznos megkzelts sztvlasztani mindazt, ami a kategria minden egyedre igaz, attl, ami
csupn a kategria tipikus egyedeire igaz. A Paradicsom kategria mellett szksg van mg a
Tipikus(Paradicsom) kategrira. A Tipikus fggvny egy kategrit egy olyan alosztlyra kpez le,
amely csak tipikus egyedekbl ll:
Tipikus(c) c
Ily mdon kpesek vagyunk a kategrikra vonatkoz fontos tnyeket feljegyezni anlkl, hogy pontos
defincikat kellene megadnunk.
Azzal, hogy a termszetes kategrik tbbsge esetn az egzakt definci megalkotsa nehzsgekbe
tkzik, rszletesen Wittgenstein foglalkozott a Philosophical Investigations c. mvben (Wittgenstein,
1953). A jtkok pldjt hasznlta fel, hogy kimutassa, a kategria egyedei inkbb egyfajta csaldi
hasonlsgban s nem valami szksges s elgsges jellegzetessgekben osztoznak.
Quine szintn tmadta a szigor definci hasznossgt (Quine, 1953). Azt mutatta ki, hogy az
agglegny defincija, mint egy nem hzas felntt frfi is gyans. Valaki megkrdjelezhetn
pldul, hogy A Ppa agglegny rtelmes llts-e. Br nem kifejezetten hamis, ez a
fogalomhasznlat mgis szerencstlen, mert az olvasnak nem szndkolt kvetkeztetsek levonst
teszi lehetv. A feszltsget fel lehetne oldani megklnbztetst tve a tudsreprezentciban val
bels hasznlatra alkalmas logikai definci s a helyes nyelvszeti hasznlat jobban rnyalt kritriumai
kztt. A msik megkaphat az elsbl a levont kvetkeztetsek szrsvel. Az is lehetsges, hogy a
nyelvszeti hasznlat kudarcai visszacsatolsknt hatnak a bels definci mdostsa rdekben,
flslegess tve a szrst.
A szvegben eredetileg aardvark (fldimalac) szerepel, ami egy malacszer dl-afrikai llatfajta. (A ford.)
A szvegben eredetileg termszetesen angol plda szerepel an aardvark s a butter/butter. (A ford.)
292
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
Vaj(x) OlvadsiPont(x, Celsius(30))
A vaj srga, kevsb sr, mint a vz, szobahmrskleten puha, magas zsrtartalm stb. Msrszt a vajnak nincs
konkrt nagysga, alakja vagy slya. Specializltabb kategrikat is definilhatunk, mint pldul NemSzottVaj,
ami szintn egy anyag, mert a nem szott vaj objektum akrmilyen rsze szintn nem szott vaj objektum. Ha
azonban az EgyKilVaj kategrit definiljuk, amely az sszes, egy kil sly vaj objektumot tartalmazza, nincs
tbb anyagunk! Ha egy kil vajat kettvgunk, nem kapunk ktszer egy kil vajat ami a valdi vilg azon
bosszant dolgainak egyike, amivel sajnos egytt kell lni.
Valjban arrl van sz, hogy vannak n. bels (intrinsic) tulajdonsgok: ezek inkbb maghoz az objektum
szubsztancijhoz tartoznak, mint az objektum egszhez. Ha valamit kettvgunk, a rszei a bels
tulajdonsgukat megtartjk legyen ez srsg, forrspont, z, szn, a tulajdonos stb. A kls (extrinsic)
tulajdonsgok ppen az ellenkezt jelentik: olyan tulajdonsgokat, mint a slyt, hosszat, alakot, funkcit stb.,
amelyeket a rszekre bontsnl megtartani nem lehet.
Az objektumok olyan osztlya, amelyek defincijban csakis bels tulajdonsgok szerepelnek, a szubsztancik,
illetve a nem megszmllhat fnevek osztlya. Az az osztly, amelynek defincijban brmilyen kls
tulajdonsg is szerepel, a megszmllhat fnevek osztlya. Az anyag kategria a legltalnosabb
szubsztanciakategria, egyetlen bels tulajdonsga sincs. A dolog a diszkrt objektumok legltalnosabb
kategrija, egyetlen kls tulajdonsga sincs. Minden fizikai objektum mindkt kategriba tartozik, gy a
kategrik egytt lteznek ugyanazokra az entitsokra utalnak.
293
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
10.2. bra - Szitucikalkulusban minden szituci (az S0-t kivve) valamilyen cselekvs
eredmnye
Egy nem res sorozat vgrehajtsa nem ms, mint az els cselekvs vgrehajtsa, majd az eredmnyl add
szituciban a marad sorozatnak a vgrehajtsa:
Eredmny([a]sorozat, s) = Eredmny(sorozat, Eredmny(a, s))
Egy szitucikalkulus gensnek tudnia kellene egy adott cselekvssorozat eredmnyt kikvetkeztetni, ez az n.
elrevett feladat (projection task). A megfelel konstruktv kvetkeztetsi mechanizmus birtokban
kpesnek kellene lennie arra is, hogy egy kvnatos eredmnyt biztost sorozatot megtalljon, ez az n.
tervksztsi feladat (planning task).
Egy mdostott wumpus vilgrl fogunk pldt venni, ahol az gens orientcijval nem trdnk, s ahol az
gens egy helyrl egy szomszdos helyre Megy. Tegyk fel, hogy gens az [1, 1]-nl s arany az [1, 2]-nl van.
A cl az aranyat az [1,1] helyen birtokoljuk. A foly esemny prediktumok a Nla(o, x, s) s Tart(o, s). A
kezdeti tudsbzis az albbi lerst tartalmazhatn:
Nla(gens, [1, 1], S0) Nla(G1, [1, 2], S0)
Ez azonban mg nem elg, mert nem mondtuk, hogy az S0-ban mi nem igaz (a problma tovbbi elemzst lsd
a 7. szakasz - Kvetkeztets alaprtelmezett informcival rszben). A teljes lers az albbi:
Nla(o, x, S0) [(o = gens x = [1, 1]) (o = G1 x = [1, 2])]
Tart(o, S0)
Arra is szksg van, hogy kijelentsk, G1 egy arany, s [1, 1] s [1, 2] szomszdosak:
Arany(G1) Szomszdos([1, 1], [1, 2]) Szomszdos([1, 2], [1, 1])
Valaki bizonyra azt szeretn bebizonytani, hogy gens a cljt elri, ha az [1, 2]-re tmegy, ott megfogja az
aranyat s az [1, 1]-re visszatr, azaz:
Nla(G1, [1, 1], Eredmny([Megy([1, 1], [1, 2]), Megfog(G1), Megy([1, 2], [1, 1])], S0)
294
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
Annl rdekesebb lehetsg az arany birtoklst biztost tervet kszteni, amit a milyen cselekvssorozat
eredmnye az arany az [1, 1]-en? krds megvlaszolsval lehet megtenni.
sorozat Nla(G1, [1, 1], Eredmny(sorozat, S0))
Ezeket az aximkat a mdostott wumpus vilgra fogjuk felrni. A mondatok rvidsge rdekben el fogjuk
hagyni az egsz mondatra vonatkoz univerzlis kvantorokat. Felttelezzk, hogy az s vltoz a szitucikra, az
a vltoz a cselekvsekre, az o vltoz az objektumokra (az genseket belertve), a g vltoz az aranyra, az x s
az y vltozk pedig a helyre vonatkoznak.
Az erre a vilgra vonatkoz lehetsgi axima azt mondja, hogy egy gens a szomszdos helyek kztt
mozoghat, az aktulis helyen megfoghatja az aranyat s elengedheti az aranyat, amelyet tartott:
Nla(gens, x, s) Szomszdos(x, y) Lehet(Megy(x, y), s)
Arany(g) Nla(gens, x, s) Nla(g, x, s) Lehet(Megfog(g), s)
Tart(g, s) Lehet(Elenged(g), s)
A hatsaxima azt lltja, hogy ha egy cselekvs lehetsges, akkor a cselekvs vgrehajtsbl add
szituciban bizonyos tulajdonsgok (foly esemnyek) rvnyesek lesznek. Az x-rl az y-ra menni cselekvs
eredmnye az y-ban tartzkodni, az aranyat megfogni eredmnye az aranyat tartani, vgl az aranyat elengedni
eredmnye az aranyat nem tartani:
Lehet(Megy(x, y), s) Nla(gens, y, Eredmny(Megy(x, y), s))
Lehet(Megfog(g), s) Tart(g, Eredmny(Megfog(g), s))
Lehet(Elenged(g), s) Tart(g, Eredmny(Elenged(g), s))
Az aximk megllaptsval tudjuk-e bizonytani, hogy a tervnk biztostja a cl elrst? Sajnos mg nem!
Elszr minden jl mkdik: a Megy([1, 1], [1, 2]) valjban lehetsges az S0-ban, s a Megy hatsaximja
meggyzhet minket, hogy az gens tnyleg elri az [1, 2]-t:
Nla(gens, [1, 2], Eredmny(Megy([1, 1], [1, 1 ]), S0))
Most tekintsk a Megfog(G1) cselekvst. Ki kell mutatni, hogy ez lehetsges az j szituciban, azaz:
Nla(G1, [1, 2], Eredmny(Megy([1, 1], [1, 2]), S0))
Fontos
Sajnos a tudsbzisunkban az ilyen konklzit semmi sem tmasztja al. Intuitve persze megrtjk,
hogy az gens Megy cselekvse az arany helyzetre nincs hatssal, gy az mg mindig az [1, 2]-ben
van, ahogy ott volt az S0 szituciban is. A problma az, hogy a hatsaxima kijelenti, hogy mi vltozik,
de nem mond semmit arrl, hogy mi nem vltozik.
A vltozatlanul megmarad dolgok reprezentlsa az n. keretproblma (frame problem). A keretproblmra
hatkony megoldst kell tallnunk, mert a valdi vilgban az id tbbsgben majdnem minden vltozatlan
marad. Minden egyes cselekvs a foly esemnyeknek csak kis tredkt befolysolja.
295
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
Az egyik megkzelts az expblicit keretaximk (frame axioms) felrsa, amelyek azt mondjk, hogy mi
marad vltozatlan. Az gens mozgsai pldul ms objektumok helyzett vltozatlanul hagyjk, hacsak azokat
az gens nem tartja magnl:
Nla(o, x, s) (o gens) Tart(o, s) Nla(o, x, Eredmny(Megy(y, z), s))
Ha sszesen F foly esemny s A cselekvs lenne, akkor O(AF) keretaximra lenne szksgnk. Msfell, ha
minden cselekvsnek legfeljebb E hatsa lenne, ahol az E tipikusan jval kisebb, mint F, akkor a trtnteket
sokkal kisebb, O(AE) nagysg tudsbzissal is ki tudnnk fejezni. Ez a reprezentcis keretproblma
(representational frame problem). A vele szorosan kapcsold kvetkeztetsi keretproblma (inferential
frame problem) egy t-lpses cselekvssorozat eredmnyeinek O(Et) idben, s nem O(Ft) vagy O(AEt)
idben val kivettse. Sorban egyms utn az sszes problmval fogunk foglalkozni. Azonban egy problma
mgis marad biztostani, hogy egy cselekvs sikeres elvgzshez minden felttelt sikerlt megfogalmazni.
gy pldul a Megy kudarccal fenyeget, ha az gens tkzben meghal. Ez az n. kvalifikcis problma
(qualification problem), melynek teljes megoldsa nincs.
Felttelezve, hogy lehetetlen cselekvsekkel nem foglalkozunk, vegyk szre, hogy a definciban szerepel
helyett. Ez azt jelenti, hogy a foly esemny akkor s csak akkor lesz igaz, ha a jobb oldali rsz igaz. Ms szval
minden foly esemnynek a kvetkez llapotban rvnyes igazsgrtkt a cselekvsnek s az aktulis
llapotban rvnyes rtknek a fggvnyeknt hatrozzuk meg. Ez azt jelenti, hogy a kvetkez llapot
teljesen meghatrozott az aktulis llapottl kiindulva, s gy ptlagos keretaximkra nincs szksg.
Az gens helyre rvnyes kvet llapot axima azt mondja, hogy gens egy cselekvs utn az y-ban lesz, ha a
cselekvs lehetsges, s az az y-ba val mozgsbl ll, vagy ha az gens mr az y-ban tartzkodott, s a
cselekvsnek a mozgshoz nem volt kze:
Lehet(a, s)
(Nla(gens, y, Eredmny(a, s)) (a = Megy(x, y))
(Nla(gens, y, s) (a Megy(y, z)))
A Tart aximja azt fejezi ki, hogy gens tarja a g-t, ha a cselekvs a g megfogst jelentette, s a cselekvs
lehetsges volt, vagy ha az gens mr tartotta a g-t s a cselekvs nem annak elengedse volt:
Lehet(a, s)
(Tart(g, Eredmny(a, s)) (a = Megfog(g)) (Tart(g, s) (a Elenged(g)))
Fontos
A kvet llapot aximk a reprezentcis keretproblmt megoldjk, mert az aximk ssz-szma
O(AE) literl. Az E hatsok s az A cselekvsek mindegyike pontosan egyszer kerl emltsre. A
literlok F klnbz axima kztt vannak sztosztva, gy egy axima tlagos nagysga AE/F.
Ez lnyegben az a megkzelts, amit a 7. fejezetben a logikai ramkr-gens tervezsnl alkalmaztunk. Az olyan aximkat, mint a
(7.4) s a (7.5), valban kvet llapot aximknak lehet nzni.
4
296
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
Az les szem olvas szreveszi, hogy ezek az aximk a Nla foly esemnyt kezelik az gens szmra, de
nem gy az arany esetben. Mg mindig nem tudjuk bebizonytani, hogy ez a hromlpses terv eljut a clhoz,
az arany elrshez az [1, 1]-ben. Amire szksgnk lenne mg, az annak a kijelentse, hogy az gens x-tl y-ig
val mozgsnak implicit hatsa (implicit effect), hogy minden, ltala megfogott arany is vele fog mozogni
(ahogy az aranyon a hangya, a hangyn a bacilus stb.). Az implicit hatsok kezelst ramifikcis
problmnak (ramification problem) nevezzk. A problmt ltalnossgban ksbb vitatjuk meg. A jelenlegi
specilis trgyterleten e problma a Nla szmra kiss ltalnosabb kvet llapot aximk felrsval
megoldhat. Az j aximk, amelyek a rgieket magukban foglaljk, azt fejezik ki, hogy minden o objektum yban tartzkodik, ha az gens az y-ba ment, s az o maga az gens, vagy brmi, amit az gens tart; vagy ha az o
mr az y-ban volt, s az gens nem ment sehov, mikzben az o maga az gens, vagy brmi, amit az gens tart.
Lehet(a, s)
Nla(o, y, Eredmny(a, s)) (a = Megy(x, y) (o = gens Tart(o, s)))
(Nla(o, y, s) (z y z a = Megy(y, z)
(o = gens Tart(o, s))))
Egy tovbbi technikai nehzsggel szmolnunk kell. Az ilyen aximkat felhasznl kvetkeztetsi eljrsnak
kpesnek kell lennie az azonossg hinyt kimutatni.A legegyszerbb eset a kt konstans esete, pldul gens
G1. Az elsrend logika ltalnos szemantikja lehetv teszi, hogy a klnbz konstansok ugyanazt az
objektumot jelentsk, a tudsbzisnak tartalmaznia kell teht az ilyen eseteket kitilt aximt. Az egyedi
elnevezsek aximja (unique names axiom) a konstansok azonossghinyt fejezi ki, a tudsbzisban ltez
minden konstansprra. Ha a ttelbizonyt rendszer az azonossghinyt felttelezi, ahelyett hogy explicit mdon
a tudsbzisban ez le lenne rva, az egyedi elnevezsek felttelezsrl (unique names assumption) beszlnk.
Az azonossghinyt ki kell jelentennk a cselekvsekre is: a Megy([1, 1], [1, 2]) cselekvs s a Megy([1, 2], [1,
1]), vagy a Megfog(G1) cselekvs nem ugyanaz. Elszr azt fogjuk mondani, hogy a cselekvsek minden tpusa
klnbz semmilyen Megy cselekvs nem lehet egy Megfog cselekvs. A cselekvsnevek minden prjra:
A(x1, , xm) B(y1, , yn)
Most kijelentjk, hogy kt, ugyanahhoz a cselekvshez tartoz cselekvsterm ugyanazt a cselekvst jelenti, ha a
benne szerepl objektumok mind azonosak:
A(x1, , xm) = B(y1, , ym) x1 = y1 xm = ym
Ezeket az lltsokat egyttesen egyedi cselekvs aximknak (unique action axioms) nevezzk. A kezdeti
llapotlers, a kvet llapot aximk, az egyedi elnevezsek aximk s az egyedi cselekvsaximk
egyttese elegend annak bizonytshoz, hogy a javasolt terv megvalstja a clt.
297
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
Vagyis mindegyik axima emlt teht nhny cselekvst, amelyek a foly esemnyt igazz, s nhnyat,
amelyek azt hamiss teszik. Ezt a krlmnyt formalizlhatjuk a PozHats(a, Fi) s a NegHats(a, Fi)
prediktumok bevezetsvel. A PozHats(a, Fi) azt jelenti, hogy az a cselekvs az Fi-t igazz, a NegHats(a, Fi)
pedig azt, hogy hamiss teszi. A fenti axima ezzel a kvetkezkppen rhat t:
Lehet(a, s)
Fi(Eredmny(a, s)) PozHats(a, Fi) [Fi(s) NegHats(a, Fi)]
PozHats(A1, Fi)
PozHats(A2, Fi)
NegHats(A3, Fi)
NegHats(A4, Fi)
Az, hogy ez mennyire automatizlhat, a keretaximk pontos formtumn mlik. Hogy az ilyen aximkra
alapozva hatkony kvetkeztetsi eljrst dolgozhassunk ki, hrom dolgot kell mg megtenni:
1. Indexeljk a PozHats s a NegHats prediktumokat az els argumentumaik szerint, hogy amikor adott egy
t idpontban bekvetkez cselekvs, a hatsait O(1) idben meg lehessen keresni.
2. Indexeljk az aximkat gy, hogy amikor vilgos mr, hogy egy cselekvs hatsa Fi, O(1) id alatt ki
lehessen keresni az Fi-re vonatkoz aximkat. Ekkor a cselekvs hatsai kztt nem szerepl foly esemny
aximival nem is kell trdni.
3. Minden szitucit reprezentljunk egy megelz szituci plusz egy nvekmnyknt. gy, amikor lpsrl
lpsre nem vltozik semmi, nem kell semmifle munkt vgeznnk. A rgebbi megkzeltsben O(F)
munka ment volna r, hogy minden foly esemny esetn a megelz Fi(s) felttelezsbl Fi(Eredmny(a, s))
felttelezst generljunk.
Minden idlpsnl teht megnzzk az aktulis cselekvst, megkeressk a hatsait s az igaz foly esemnyek
halmazt felfrisstjk. Minden idlpsben tlagosan E ilyen frisstssel kell szmolnunk, ami az ered
komplexitsra O(Et)-t ad. Ez megadja a kvetkeztetsi keretproblma megoldst.
298
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
A 20. szzad az idnek egy intervalluma. Intervallumok a tr-id olyan darabki, amelyek kt idpont kztt az
egsz teret tartalmazzk. A Periodus(e) fggvny az e esemnyt bezr legkisebb intervallumot jelli. A
Tartam(i)
egy
intervallum
ltal
foglalt
id
hossza,
mondhatjuk
teht,
hogy
Tartam(Periodus(MsodikVilgHbor)) > v(5).
Ausztrlia egy hely, egy darabka rgztett trbeli hatrokkal. A hatrok idben vltoznak, geolgiai vagy
politikai okoknl fogva. A Benne prediktumot fogjuk hasznlni az olyan rszesemny relci megjellsre,
amely akkor ll fenn, ha egy esemny trbeli vetlete Rsze egy msik esemny vetletnek:
Benne(Sydney, Ausztrlia)
Az esemnykategria fogalma segt megvlaszolni azt a krdst, amit igyekeztnk elkerlni, amikor a 10.3.
alfejezetben a cselekvsek hatsairl beszltnk. Mire hivatkoznak pontosan az olyan logikai termek, mint a
Megy([1, 1], [1, 2])? Esemnyek ezek?
299
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
A vlasz, taln meglep, de az, hogy nem. Ennek megrtshez nzznk meg kt azonos cselekvst tartalmaz
tervet, mint pldul:
[Megy([1, 1], [1, 2]), Megy([1, 2], [1, 1]), Megy([1, 1], [1, 2])]
Ebben a tervben a Megy([1, 1], [1, 2]) nem lehet egy esemny neve, mert kt klnbz esemny van, amelyek
klnbz idpontban trtnnek meg. Helyette a Megy([1, 1], [1, 2]) egy esemnykategria neve azok az
esemnyek, amikor az gens az [1, 1]-rl az [1, 2]-re lp t. A hromlpses terv azt mondja ki, hogy e hrom
esemnykategria pldnyai fognak elfordulni.
Jegyezzk meg, hogy ez az els alkalom, amikor a kategrik megnevezsre komplex termeket vetettnk be,
egyszer konstansszimblumok helyett. Ez nem jelent j nehzsget. Az argumentumstruktrt valjban a
hasznunkra is fordthatjuk. Az argumentumok eliminlsa az ltalnosabb kategrik bevezetst teszi lehetv:
Megy(x, y) MegyHov(y) Megy(x, y) MegyHonnan(x)
Az llts e formja annyira gyakori, hogy kln rvidtst fogunk r alkalmazni: E(c, i), aminek az a jelentse,
hogy a c esemnykategria egy eleme egy i intervallum, vagy az esemny rszesemnye:
E(c, i) e e c RszEsemnye(e, i)
gy:
E(Repl(Shankar, NewYork, jdelhi), Tegnap)
300
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
3.7. Folyamatok
Az eddig ltott esemnyek meghatrozott struktrval rendelkez diszkrt esemnyek (discrete events) voltak.
Shankar utazsnak van kezdete, kzepe s vge. Ha flbeszaktjuk, az esemny megvltozik nem lesz tbb
egy New York s jdelhi kztti utazs, hanem helyette egy New York s egy Eurpban valahol fekv pont
kztti utazs. A Repl(Shankar) ltal jellt esemnykategrinak ezzel szemben ms a jellege. Ha Shankar
replsnek egy rvid intervallumt vesszk, mondjuk a harmadik 20 perces idszakaszt (amikor is
trelmetlenl vrja mr a msodik csomag mzben prklt fldimogyort), ez az esemny mg mindig a
Repl(Shankar) egy rsze. Valjban ez akrmilyen rszintervallum esetben is igaz.
Az ilyen tulajdonsg esemnyek kategriit folyamat- (process) kategriknak, illetve folytonos esemny
(liquid event) kategriknak nevezzk. Egy folyamat akrmilyen rszintervalluma ugyanannak a
folyamatkategrinak a tagja. A diszkrt esemnyekre kialaktott jellst alkalmazva mondhatjuk pldul, hogy
Shankar valamikor tegnap replt:
E(Repl(Shankar), Tegnap)
Gyakran ki szeretnnk jelenteni, hogy valamilyen folyamat egy teljes intervallumon keresztl tartott, s nem
csak annak valamilyen rszintervallumban. Erre T prediktumot fogjuk hasznlni:
T(Dolgozik(Istvn), MaiEbdId)
T(c, i)-nek az a jelentse, hogy egy c tpus esemny az egsz i intervallum ideje alatt tartott azaz az esemny
pontosan akkor kezddik s fejezdik be, amikor az intervallum.
Folykony s nem folykony esemnyek kztti megklnbztets pontosan analg a szubsztancik, avagy az
anyag s az egyedi objektumok kztti klnbsggel. Tny, hogy egyes kutatk folykony esemnyeket
temporlis szubsztanciknak (temporal substances) neveztk el, mg a vajszer dolgok trbeli szubsztancik
(spatial substances).
A folytonos esemnyek a folyamatosan vltoz folyamatokon tlmenen kpesek a folyamatosan nem vltoz
folyamatok lersra is. Ezeket gyakran llapotoknak (states) nevezzk. A Shankar New Yorkban tartzkodik
pldul egy olyan llapotkategria, amit Benne(Shankar, NewYork)-kal lehetne jellni. Azt, hogy Sankar az
egsz mai napot New Yorkban tlttte, gy rhatnnk, hogy:
T(Benne(Shankar, NewYork), Ma)
10.4. bra - sszetett esemnyek brzolsa. (a) T(Mindkett(p, q), i), mskppen T(p o
q, i), (b) T(Egyik(p, q), i), (c) T(VagyVagy(p, q), i).
Tudsbzis reprezentci
pedig, hogy a kt cselekvst felvltva tette. E kt lehetsg megjellsre az Egyik s a VagyVagy fggvnyeket
fogjuk hasznlni. A komplex esemnyeket a 10.4. bra szemllteti.
3.8. Intervallumok
Az id fontos minden cselekv gens szmra, s az idintervallumok reprezentlsra szmos erfeszts
trtnt. Az idintervallumok kt fajtjval foglalkozunk: az idpillanatokkal s a kiterjesztett intervallumokkal.
A klnbsg kztk az, hogy csak az idpillanatnak lehet zrus idtartama:
Partci({IdPillanatok, KiterjesztettIntervallumok}, IdIntervallumok)
i IdIntervallumok (Tartam(i) = Msodperc(0)
Most egy idsklt konstrulunk, amelynek pontjait idpillanatokhoz rendeljk hozz; ezzel abszolt
idpontokat kapunk. Az idskla tetszleges lehet. Az idt msodpercekben fogjuk mrni, s kimondjuk, hogy a
0. id az 1900. janur 1-jei (GMT) jfl. A Kezdet s a Vg fggvnyek az idintervallum legkorbbi s a
legksbbi idpillanatt adjk vissza, az Id fggvny egy idpillanathoz tartoz pontot keres ki az idskln.
Az IdTartam fggvny megadja a kezdeti id s a vgid kztti klnbsget.
IdIntervallum(i) IdTartam(i) = (Id(Vge(i)) Id(Kezdete(i)))
Id(Kezdete(AD1900)) = Msodperc(0)
Id(Kezdete(AD2001) = Msodperc(3187324800)
Id(Vge(AD2001)) = Msodperc(3218860800)
IdTartam(AD2001) = Msodperc(31536000)
Hogy a szmokat knnyebb legyen olvasni, vezessnk be egy hatrgumentum Dtum fggvnyt (ra, percek,
msodpercek, hnap, nap s v), melynek visszaadott rtke egy pont az idskln:
Id(Kezdete(AD2001)) = Dtum(0, 0, 0, 1, Janur, 2001)
Dtum(0, 20, 21, 24, 1, 1995) = Msodperc(3000000000)
Annak megadsra, hogy II. Erzsbet uralkodsa VI. Gyrgy uralkodst kvette, Elvis uralkodsa viszont az
1950-es vekkel tlapoldott, a kvetkezt rhatjuk:
Utna(Uralkodsa(II.Erzsbet), Uralkodsa(VI.Gyrgy))
tlapoldik(tvenesvek, Uralkodsa(Elvis))
Kezdete(tvenesvek) = Kezdete(AD1950)
Vge(tvenesvek) = Vge(AD1950)
302
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
Egy msik ilyen aspektus, amely a szerencstlensgektl eltekintve, ngy- vagy nyolcvenknt vltozik, az
orszg elnke. Felvehet, hogy az Elnk(USA) egy olyan logikai term, amely klnbz idkben klnbz
objektumokat jelent. Ez sajnos nem lehetsges, mert egy term egy adott modellstruktrban pontosan egy
objektumot jell meg. (Az Elnk(USA, t) jellhetne klnbz objektumokat t rtknek megfelelen, az
ontolgink azonban az idpontokat s a foly esemnyeket sztvlasztja.) Egyetlen lehetsg, hogy az
Elnk(USA) egy olyan egyedi objektumot jell, amely klnbz idkben klnbz emberekbl ll. Az
Elnk(USA), mint objektum, George Washington volt 1789-tl 1796-ig, John Adams volt 1796-tl 1800-ig stb.
(lsd 10.6. bra). Azt, hogy George Washington 1790-ben elnk volt, a kvetkezkppen rhatjuk le:
T(Elnk(USA) = GeorgeWashington, AD1790)
Azonban vatosnak kell lenni. Ebben a mondatban az = inkbb egy fggvny, s nem egy standard logikai
opertor. Az interpretci nem az, hogy GeorgeWashington s az Elnk(USA) 1790-ben logikailag azonosak. A
logikai azonossg nem olyan dolog, ami idben vltozhat. A logikai azonossg az egyes objektumok azon
rszesemnyei kztt ll fenn, amelyeket az 1790-es elnki peridus definilt.
Ne tvessze ssze a GeorgeWashington fizikai objektumot az atomok egy gyjtemnyvel. George Washington
logikailag nem azonos semmilyen konkrt atomgyjtemnnyel, mert az az atomhalmaz, amibl ll, idben
lnyegesen vltozik. Neki rvid lettartama van, minden atomnak sajt hossz lettartama van. Bizonyos
peridusban metszik egymst, amikor is az atom temporlis szelete a RszEsemnye George-nak, majd kln
tjukat jrjk.
303
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
A reifikls sz a latin res, avagy dolog szbl szrmazik. John McCarthy a dolgosts (thingification) elnevezst javasolta, de ez nem
terjedt el.
7
304
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
(Superman = Clark) (Hiszi(Lujza, Repl(Superman)) Hiszi(Lujza, Repl(Clark)))
Bizonyos rtelemben ez igaz is. Egy bizonyos szemlyrl, akit nha Clarknak hvnak, Lujza azt hiszi, hogy tud
replni. Ms rtelemben azonban ez nincs rendjn. Ha megkrdezzk Lujzt, hogy Clark tud-e replni?,
minden bizonnyal nemmel vlaszolna. A reifiklt objektumok s esemnyek jl mkdnek a Hiszi els
rtelmezse esetn, a msodikhoz viszont az szksges, hogy reifikljuk ezen objektumok s esemnyek
lerst, gy Clark s Superman klnbz lersok legyenek, annak ellenre, hogy ugyanarra az objektumra
vonatkoznak.
Azt a tulajdonsgot, hogy egy termet egy vele ekvivalens termmel szabadon helyettesthetnk, formlisan
referencilis tlthatsgnak (referential transparency) nevezzk. Elsrend logikban minden relci
referencilisan tlthat. Szmunkra az lenne a j, ha a Hiszi (s ms tletlogikai attitdk is) olyan
relcikknt lennnek definilhatk, melynek msodik argumentuma elmosdott (opaque) azaz, ahol
ekvivalens termeket egymssal nem lehet helyettesteni az rtelmezs megvltoztatsa nlkl.
Ennek kt mdja van. Az els a logika egy j vltozatnak az n. modlis logiknak (modal logic) a
hasznlata, amelyben az olyan tletlogikai attitdk, mint a Hiszi s a Tudja referencilisan elmosdott modlis
opertorok (modal operators) lesznek. Ezzel a megkzeltssel az irodalmi s trtneti megjegyzsek
keretben foglalkozunk. A msodik, a tovbbiakban kifejtett megkzelts a hatkony elmosdottsg elrse a
klnben referencilisan tlthat nyelvben a mentlis objektumok n. szintaktikai elmlete (syntactic theory)
rvn. Ez azt jelenti, hogy mentlis objektumokat fzrekkel (strings) reprezentlunk. Az eredmny az gens
tudsbzisnak egy olyan durva modellje, ahol a tudsbzis az gens ltal elhitt lltsokat reprezentl
fzrekbl ll. Egy fzr nem ms, mint egy szimblumlistt megjell komplex term, gy a Repl(Clark)
esemnyt a [R, e, p, , l, (, C, l, a, r, k, )] karakterfzrrel reprezentljuk, amit Repl(Clark)-knt fogunk
rvidteni. A szintaktikai elmlet eleme az egyedi fzr axima (unique string axiom), amely azt mondja ki,
hogy kt fzr akkor s csak akkor azonos, ha azonos karakterekbl ll. Ebben a megfogalmazsban a Clark =
Superman ellenre Clark Superman.
Most meg kell adnunk a fzr reprezentcis nyelv rszre a szintaxist, a szemantikt s a bizonytsi elmletet,
pontosan gy, ahogyan ezt a 7. fejezetben tettk. A klnbsg az, hogy ezeket most mind elsrend logikban
kell definilnunk. A Jelent fggvnnyel kezdnk, amely a fzrt arra az objektumra kpezi le, amit jell. A Neve
egy olyan fggvnnyel definilhat, amely egy objektumot az azt megnevez fzrre kpezi le. A Clark s a
Superman jells jelentse egy objektum, amire a VasEmber konstansszimblummal fogunk hivatkozni, s
aminek a neve a tudsbzisban lehet Clark, Superman vagy valamilyen ms konstans, mondjuk X11.
Jelent(Clark) = VasEmber Jelent(Superman) = VasEmber
Neve(VasEmber) = X11
A kvetkez lps a kvetkeztetsi szablyok definilsa egy logikai gens szmra. Kvnhatnnk pldul,
hogy egy logikai gens kpes legyen Modus Ponenst elvgezni: ha elhiszi a p-t, s elhiszi, hogy p q, akkor
elhiszi a q-t is. Az axima els verzija valahogy gy nzhetne ki:
Logikaigens(a) Hiszi(a, p) Hiszi(a, p q) Hiszi(a, q)
Ez azonban helytelen, mert a p q fzr tartalmazza ugyan a p s q betket, de semmi kze az olyan
fzrekhez, amelyekben a p s q vltozk rtkei szerepelnek. A helyes megfogalmazs az albbi:
Logikaigens(a) Hiszi(a, p) Hiszi(a, Concat(p, , q)) Hiszi(a, q)
ahol a Concat egy fzrfggvny, amely az elemeit konktenlja. A Concat(p, , q)-t le fogjuk rvidteni p
q-ra. Azaz x elfordulsa egy fzren bell azt jelenti, hogy az x vltoz rtkt be kell helyettesteni. A
Lisp-programozk ebben felismerik a backquote opertort, a Pearl-programozk pedig a $-vltoz interpolcit.
Ha Modus Ponensen kvl ms kvetkeztetsi szablyokat is hozzvesznk, olyan krdsek megvlaszolsra
lesznk kpesek, mint a Feltve, hogy a logikai gens ezeket a premisszkat ismeri, kpes-e azt a konklzit
kikvetkeztetni?. A kznsges kvetkeztetsi szablyokon tlmenen szksgnk van hiedelemspecifikus
szablyokra is. gy pldul az albbi szably azt mondja ki, hogy ha egy logikai gens elhisz valamit, akkor azt
is elhiszi, hogy elhiszi azt.
Logikaigens(a) Hiszi(a, p) Hiszi(a, Hiszi(Neve(a) , p))
305
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
Az ilyen gens, aximinkbl addan, minden rvnyes konklzit kpes azonnal kikvetkeztetni. Ezt a
jelensget logikai mindentudsnak (logical omniscience) hvjk. Szmos ksrlet trtnt arra, hogy korltos
racionalits genseket definiljunk, amelyek vges id alatt korltozott szm kvetkeztetsre kpesek. Ezek
egyike sem teljesen kielgt, azonban e megfogalmazsok lehetv teszik, hogy korltos gensekrl igen
korltozott terjedelm jslsokat vgezznk.
Pldnkat folytatva, Lujza tudja, hogy Clark vagy tud replni, vagy nem, ha tudja, hogy Clark tud replni, vagy
ha tudja, hogy Clark nem tud replni.
A tudja, mi koncepci valamivel bonyolultabb. Ksrtst rezhetnk arra, hogy azt lltsuk, egy gens tudja,
mi Bla telefonszma, ha ltezik egy x, amirl az gens azt tudja, hogy x = TelefonSzma(Bla). De ez gy nem
j, mert pldul az gens tudhatja, hogy Aliz s Bla telefonszma ugyanaz (azaz TelefonSzma(Aliz) =
TelefonSzma (Bla)), de ez sokat nem segt, ha Aliz telefonszmt sem tudja. A tudja, mi jobb defincija azt
mondja ki, hogy az gensnek valami olyan x-et kell ismernie, amely egy szmjegyekbl ll fzr s amely Bla
telefonszma:
TudjaMi(a, TelefonSzma(b))
x Tudja(a, x = TelefonSzma(b)) x SzmjegyFzr
Termszetesen ms krdsek esetn az elfogadhat vlasznak msok lesznek a kritriumai. Arra a krdsre,
hogy Mi New York llam fvrosa?, a j vlasz Albany, s nem az, hogy az a vros, ahol a vroshza ll.
Hogy ez lehetsges legyen, a TudjaMi-t hromargumentumos relciv alaktjuk t: lesz benne egy gens, egy
term s egy prediktum, amelynek igaznak kell lennie a vlaszra alkalmazva. Pldul:
TudjaMi(gens, Fvros(NewYork), SajtNv)
TudjaMi(gens, TelefonSzma(Bla), SzmjegyFzr)
Ha a hiedelem objektuma egy olyan llts, amely idben vltozhat, ezt a T opertorral a fzren bell rhatjuk
le. Ekkor mondhatnnk azt, hogy Lujza ma hiszi, hogy Superman tegnap tudott replni:
T(Hiszi(Lujza, T(Repl(Superman), Tegnap), Ma)
Tudsbzis reprezentci
Inicilizl(Kikeres(a, TelefonSzma(b)),
TudjaMi(a, TelefonSzma(b), SzmjegyFzr), t)
Az informcigyjt s az azt felhasznl terveket sokszor rviden futsi idej vltozknak (runtime
variables) nevezzk, ami a korbban lert rtkbehelyettest vltoz konvencijhoz szorosan kapcsoldik.
Bla telefonszmnak a kikeressre, majd a trcszsra vonatkoz tervet az albbi alakban fel lehet rni:
[Kikeres(gens, TelefonSzma(Bla), n), Trcsz(n)]
Itt n egy futsi idej vltoz, aminek rtkt a Kikeres cselekvs fogja rgzteni, s amit majd a Trcsz
cselekvs felhasznlhat. Az ilyen tervek srn elfordulnak a rszben megfigyelhet trgyterleteken. Ltni
fogunk erre pldkat a kvetkez alfejezetben s a 12. fejezetben.
A legmodernebb laptopot bemutat lap relevns lenne, ha azonban a vsrlsra nem ad lehetsget, nem ajnlat.
Egyelre azt fogjuk mondani, hogy egy lap ajnlat, ha a lapon egy HTML-hivatkozson, vagy rlapon bell a
vsrol vagy az ra szavakat tartalmazza. Ms szval, ha a lap tartalmaz egy <a vsrol </a> alak
fzrt, akkor ez egy ajnlat. A vsrol helyett lehetne az ra, illetve az a helyett a form. Felrhatjuk
ennek axiomatikus alakjt:
10.7. bra - Egy absztrakt online bolt weblapja, ahogy egy bngszt hasznl ember
ltja (fell), s a hozz tartoz HTML-fzr, ahogy azt a bngsz vagy a vsrl gens
ltja (alul). A HTML-ben a < s a > kztti karakterek a jell direktvk, amelyek
meghatrozzk, hogy a lapot hogyan kell kijelezni. Az <i>Vlasszon</i> fzr pldul
jelzi, hogy dlt betre kell tkapcsolni, a Vlasszon szt kijelezni s a dlt bet
hasznlatt befejezni. Egy lapazonost, mint amilyen a http://absz-bolt.com/zene az n.
egysges erforrs azonost (uniform resource locator, URL).Az <a
307
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
Most szksges relevns lapokat tallni. A stratgia az online bolt honlapjtl kezdeni, s azokkal a lapokkal
foglalkozni, amelyet a relevns linkek mentn el lehet rni.8 gensnk szmos boltrl fog tudni, pldul:
Amazon OnlineBolt HonLap(Amazon, amazon.com)
Ebay OnlineBolt HonLap(Ebay, ebay.com)
ltBolt OnlineBolt HonLap(ltBolt, lt-bolt.com)
A Link(tl, ig) prediktum jelentse, hogy a tl URL-tl az ig URL-ig ltezik egy hiperhivatkozs (lsd 10.13.
feladat). Hogy a RelevnsLnc-ot definilhassuk, nem valamilyen rgi hiperhivatkozst kell kvetnnk, hanem
azokat, amelyeknl a csatolt hivatkoz szveg jelzi, hogy a hivatkozs a lekrdezs szempontjbl relevns.
Erre a LinkSzveg(tl, ig, szveg)-et fogjuk hasznlni, melynek jelentse, hogy ltezik egy hivatkozs tl-tl igig, szveg-gel mint hivatkoz szveggel. A start s a vge URL-ek kztti hivatkozslnc a d lers
A hivatkozskvet stratgia alternatvja egy internetkeres gpnek a hasznlata. Az internetkeressrl, az informcikinyers mgtt
hzd technolgikrl a 23.2. alfejezetben lesz sz.
8
308
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
Most definilnunk kell, hogy egy lekrdezs szempontjbl egy szveg mikor lesz egy RelevnsKategriaNv.
Elszr tudnunk kell a fzreket s az ltaluk megnevezett kategrikat kapcsolatba hozni. J lesz erre a Nv(s,
c), amely azt lltja, hogy az s fzr a c kategria neve mondhatjuk pldul hogy Nv(laptop,
LaptopSzmtgp). A Nv prediktumra tovbbi pldk a 10.8. brn tallhatk. A kvetkez a relevancia
definilsa. Tegyk fel, hogy a lekrdezs a laptop. RelevnsKategriaNv(lekrdezs, szveg) igaz lesz,
feltve, hogy az albbiak kzl egy teljesl:
A szveg s a lekrdezs ugyanazt a kategrit nevezi meg pldul laptop szmtgp s laptop.
A szveg egy szuperkategrit nevez meg, mint pldul szmtgp.
A szveg egy alkategrit nevez meg, mint pldul ultraknny laptop.
A RelevnsKategriaNv logikai defincija az albbi:
RelevnsKategriaNv(lekrdezs, szveg)
c1, c2 Nv(lekrdezs, c1) Nv(szveg, c2) (c1 c2) (c2 c1) (10.1)
Msklnben a hivatkoz szveg irrelevns, mert egy, ezen a vonulaton kvli kategrit nevez meg, mint
pldul a mainframe szmtgp vagy pzsit s kert.
Hogy kpesek legynk relevns kapcsolatokat kvetni, lnyeges, hogy rendelkeznnk kell a termkek gazdag
kategriahierarchijval. E hierarchia legfels rsze hasonlthat pldul a 10.8. brn lthat hierarchira. Nem
lenne j tlet az sszes lehetsges bevsrlsi kategrit listzni, mert a bevsrlnak mindig lehetnek j
kvnalmai, s a termkgyrtk mindig j termkekkel fognak elrukkolni, hogy a vsrlkat kielgtsk
(elektromos trdmelegt?). Egy, mondjuk ezer kategribl ll ontolgia azonban a vsrlk tbbsge
szmra hasznos eszkznek fog bizonyulni.
309
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
szveggel, amit mindenfle technikai specifikci kvet, a csomagoltl elvrnnk, hogy az albbi informcit
nyerje ki:
lc, ajnlat lc LaptopSzmtgp ajnlat TermkAjnlat
KpernyNagysg(lc, Cm(32)) KpernyTpus(lc, SznLCD)
MemriaNagysg(lc, Mbyte(512)) CPUSebessg(lc, GHz(2,4))
AjnlottTermk(ajnlat, lc) Bolt(ajnlat, AbsztBolt)
URL(ajnlat, abszt-bolt.com/szg/34356.html)
ra(ajnlat, Ft(300000)) Dtum(ajnlat, Ma)
310
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
Ez a plda nhny olyan problmt hivatott megmutatni, amelyek akkor jelentkeznek, ha a kereskedelmi
tranzakcikhoz szksges tudsszervezst komolyan vesszk. Vegyk szre pldul, hogy az r az ajnlatnak,
s nem magnak a termknek az attribtuma. Ez fontos, mert egy adott bolt ajnlata naprl napra vltozhat, akr
ugyanarra az egyedi laptopra nzve. Egyes kategrik esetn mint pldul a hzak s a festmnyek esetn
ugyanazt az egyedi objektumot klnbz kzvettk egy idben klnbz ron is ajnlhatjk. Tbb
bonyodalom is elkpzelhet, amelyek kezelsvel nem foglalkoztunk. Ilyen pldul annak a lehetsge, hogy az
r fgghet a fizets mdjtl, vagy hogy a vsrlra bizonyos kedvezmnyek vonatkozhatnak. sszegezve, sok
rdekes munka mg htramaradt.
Az utols feladat a kiemelt ajnlatok sszehasonltsa. Tekintsk pldul az albbi hrom ajnlatot:
A: 2,4 GHz CPU, 512 Mbyte RAM, 80 Gbyte diszk, DVD, CDRW, 350000 Ft
B: 2,0 GHz CPU, 1 Gbyte RAM, 120 Gbyte diszk, DVD, CDRW, 400000 Ft
C: 2,2 GHz CPU, 512 Mbyte RAM, 80 Gbyte diszk, DVD, CDRW, 400000 Ft
A C-t az A dominlja. Az A olcsbb s gyorsabb, klnben ugyanolyan. ltalnossgban azt mondjuk, hogy X
dominlja Y-t, ha X legalbb egy attribtum esetben kedvezbb rtk, s semmilyen ms attribtum esetben
sem rosszabb. Az A s a B kzl egyik sem dominlja a msikat. Hogy megllaptsuk, melyik a jobb, tudnunk
kell, hogy a vsrl hogyan mrlegeli a CPU sebessgt s rt a memrihoz s a diszkkapacitshoz kpest.
Tbbszrs attribtum esetben a preferencik ltalnos trgyalst a 16.4. alfejezet tartalmazza. Most az
gensnk egyszeren ki fogja jelezni a vsrl lersval megegyez, nem dominlt ajnlatok listjt. Ebben a
pldban sem az A, sem a B nem dominlt. Jegyezzk meg, hogy ez az eredmny azon a feltevsen alapul, hogy
mindenki jobban kedveli az olcsbb rakat, a gyorsabb processzorokat s a nagyobb trat. Bizonyos
attribtumok, mint pldul a notebook kpernymrete, a vsrl partikulris preferenciitl fggenek (a
hordozhatsg a lthatsggal szemben). Az ilyenekrl a vsrl gensnek a felhasznlt kell krdeznie.
A lert vsrl gens egy egyszer rendszer, s szmos finomtsa lehetsges. Mgis elegend a kpessge arra,
hogy a megfelel terletspecifikus tudssal a vsrlt tnylegesen tudja segteni. Deklaratv konstrukcija miatt
knnyen felsklzhat bonyolultabb alkalmazsokhoz. Ennek az alfejezetnek a f clja az volt, hogy
kimutassuk, hogy bizonyos tudsreprezentci klnskppen a termk hierarchija szksges az ilyen
tpus gensek szmra, s ha mr az ilyen formj tuds rendelkezsre ll, a tbbi mr nem is olyan nehz egy
tudsalap gens szmra.
311
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
hogy Hga(Mria, Jnos). A kategrikat a Rszhalmaza llel kapcsolhatjuk ssze. A krumplik s a nyilak
rajzolsa annyira szrakoztat, hogy knny ksrtsbe esni. Tudjuk pldul, hogy minden szemly anyja egy
nnem szemly, szabad-e akkor a Szemly-tl a NnemSzemly-ig egy Anyja lt hzni? A vlasz nem,
merthogy az Anyja egy relci egy szemly s az anyja kztt, a kategriknak viszont nincsen anyjuk.9 Emiatt
a kapcsolatra a 10.9. brn egy kln jellst hasznltunk egy ketts vonallal trtn bekeretezst. Ez a
kapcsolat azt lltja, hogy:
x x Szemly [y Anyja(x, y) y NnemSzemly]
x Szemly Lba(x, 2)
Mint korbban, most is vatosnak kell lennnk, nehogy azt lltsuk, hogy kategrinak van kt lba. A 10.9.
bra egyszeres vonallal vgzett keretezse jelzi az egy kategria minden tagjnak tulajdonsgaira vonatkoz
lltst.
A szemantikus hl jellsrendszere igen alkalmas a 10.2. alfejezetben bevezetett tpus rkldses
(inheritance) kvetkeztets vgrehajtsra. gy szemly rvn, Mria rkli azt a tulajdonsgot, hogy kt lba
van. Ahhoz, hogy kitalljuk, hny lba van Mrinak, az rkldses algoritmus kveti a Tagja lt a Mri-tl
az t tartalmaz kategriig, majd a Rszhalmaza lt a hierarchiba felfel, amg egy olyan kategrit nem tall
meg, amelyhez ltezik egy bekeretezett Lba l ebben ez esetben ez Szemly kategria lesz. Ennek az
rkldses algoritmusnak az egyszersge s hatkonysga a logikai ttelbizonythoz kpest, a szemantikus
hlk egyik f vonzereje volt.
Az rklds komplikldik, amikor egy objektum egyszerre tbb kategrihoz tartozhat, vagy pedig amikor
egy kategria tbb kategria rszhalmaza. Ezt az esetet tbbszrs rkldsnek (multiple inheritance)
nevezzk. Az ilyen helyzetben a rkldses algoritmus esetleg kt vagy tbb, egymssal ellenttes vlaszt tall
a felkrsre. Ennl fogva a tbbszrs rklds bizonyos objektumorientlt programozsi (object-oriented
programming, OOP) nyelvekbl, mint amilyen pldul a Java, ami az osztlyhierarchiban rkldst hasznl,
ki van zrva. Szemantikus hlkban a tbbszrs rkldst ltalban megengedjk, de ennek rszletes
trgyalst a 10.7. alfejezetre hagyjuk.
Bizonyos rendszerek nem tudtak klnbsget tenni egy kategria tagjnak tulajdonsgai s kategria mint egsz tulajdonsgai kztt. Ez
egyenes ton vezethet inkonzisztencikhoz, ahogy ezt Drew McDermott kiemelte az Artificial Intelligence Meets Natural Stupidity cm
cikkben (McDermott, 1976). Ms gyakori problma volt a rszhalmaz s a tagsg kapcsolatoknl alkalmazott IsA vlasztssal, az angol
hasznlatnak megfelelen: a cat is a mammal (a macska egy emls) s Fifi is a cat (Fifi egy macska). E tmkrl tbbet lsd 10.25.
feladat.
9
312
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
A kvetkeztets msik kznsges formja az inverz kapcsolatok (inverse links) hasznlata. Pldul a
VanHga a Hga inverze, azaz:
p, s VanHga(p, s) Hga(s, p)
Ezt az lltst megfogalmazhatjuk szemantikus hlval, feltve hogy a kapcsolatok reifikltak (reified), azaz
nll objektumnak tekinthetk. gy pldul VanHga objektumot az Inverze llel lehetne sszekapcsolni a
Hga objektummal. Ha egy lekrdezs azt firtatn, hogy ki Jnosnak a Hga, az rkldses algoritmus
felfedezheti, hogy a VanHga a Hga inverze, s a lekrdezst gy megvlaszolhatja, hogy a VanHga
kapcsolatot Jnos-tl Mri-ig kveti vgig. Az inverz informci nlkl esetleg szksges lehetne az sszes
nnem szemlyt megvizsglni, van-e netn Hga kapcsolata Jnossal. Ez amiatt van gy, mert a szemantikus
hl kzvetlen indexelst csak az objektumok, a kategrik s a bellk indul kapcsolatok esetn biztost. Az
elsrend logika nyelvben ez annak felel meg, mintha a tudsbzist a prediktumok csakis els argumentumai
szerint indexelnnk.
Az olvas taln felfedezte mr a szemantikus hl jellsnek egy nyilvnval htrnyt az elsrend logikhoz
kpest. A krumplik kztti lek csak binris relcikat reprezentlnak. A Repl(Shankar, NewYork, jdelhi,
Tegnap) lltst a hlban kzvetlenl megfogalmazni nem tudjuk. Az n rtk lltsok hatst megkaphatjuk
azonban, ha az lltst magt egy, az esemnyek megfelel kategrijhoz tartoz esemnyknt reifikljuk (lsd
10.3. alfejezet). A 10.10. bra ehhez a konkrt esemnyhez tartoz szemantikus hlstruktrt mutat. Jegyezzk
meg, hogy a binris relcikra vonatkoz korltozs a reifiklt fogalmak gazdag ontolgijt teszi szksgess.
Az ebben a fejezetben kifejlesztett ontolgia zme tnylegesen a szemantikus hls rendszerekben gykerezik.
313
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
lltsok reifiklsa lehetv teszi, hogy az elsrend logika minden rgztett, fggvnymentes atomi lltsa
reprezentlhat szemantikus hls jellssel. Univerzlisan kvantifiklt lltsok bizonyos tpusai
reprezentlhatk a kategrikra alkalmazott inverz kapcsolatok, valamint egyszeresen s ktszeresen
bekeretezett lek alkalmazsval, ettl mg persze az elsrend logiktl messze vagyunk. A negls, a
diszjunkci, a begyazott fggvnyszimblumok s az egzisztencilis kvantifikls mind hinyzik. Manapsg
lehetsges a jells kiterjesztse, hogy az az elsrend logikval ekvivalens legyen ilyenek pldul a Piercefle egzisztencilis grfok vagy Hendrix-fle particionlt szemantikus hlk (Hendrix, 1975) ez viszont a
szemantikus hlk f elnyt az rkldses folyamat egyszersgt s tlthatsgt semmisti meg. A
tervezk nagy hlkat pthetnek, s mg mindig lehetnek j tleteik, hogy mely lekrdezsek lesznek
hatkonyak, mert (a) az rkldses eljrs lpseit knny vizualizlni, (b) egyes esetekben a lekrdezs
nyelve olyan egyszer, hogy bonyolult lekrdezseket feltenni nem is lehet. Azokban az esetekben, amikor a
kifejezer tlsgosan korltozott, szmos szemantikus hlrendszer a procedurlis kiegsztshez
(procedural attachment) folyamodik, hogy a hinyokat kitltse. A procedurlis kiegszts egy olyan mdszer,
amikor egy bizonyos relcira vonatkoz lekrdezs (nha llts) egy, a relcihoz megtervezett specilis
eljrs, s nem egy ltalnos rkldses algoritmus meghvst eredmnyezi.
A szemantikus hlk egyik legfontosabb aspektusa, hogy kpesek a kategrik szmra az alaprtelmezett
rtkeket (default values) reprezentlni. A 10.9. bra gondos vgignzsvel szrevehetjk, hogy Jnosnak egy
lba van annak ellenre, hogy egy szemly, s minden szemlynek kt lba van. Egy tisztn logikai
tudsbzisban ez egy ellentmonds lenne, de a szemantikus hlban az az llts, hogy minden szemlynek kt
lba van, egy alapeseti llts, azaz egy szemlyrl felttelezzk, hogy kt lba van, ha nincs ezzel ellentmond
specifikusabb informci. Az alapeseti szemantikt termszetesen az rkldses kvetkeztets knyszerti ki,
mert a kapcsolatokat magtl az objektumtl (itt Jnostl) felfel kveti, s megll, hacsak egy rtket meg nem
tall. Azt mondjuk, hogy az alapeseti rtket egy specifikusabb rtk fellrhatja (overridden). Vegyk szre,
hogy lbak szmt fell tudnnk rni egy EgyLbSzemly kategria ltestsvel, ami a Szemly Rszhalmaza
lenne, s amelynek Jnos lenne a tagja.
A hl szigoran logikai szemantikjt megtarthatjuk, ha azt mondjuk, hogy a Lba llts a Jnosra vonatkoz
kivtelt tartalmazza:
x x Szemly x Jnos Lba(x, 2)
Egy rgztett hl esetn ez szemantikusan megfelel, azonban ha sok kivtelnk lesz, kevsb tmr lesz a
felrsunk, mint a hls jells maga. Tbb lltssal frisstett hl esetn az ilyen megkzelts sajnos kudarcra
van tlve amit valjban mondani szeretnnk az az, hogy minden, egyelre mg ismeretlen egylb szemly
szintn kivtelnek szmt. Ezzel a tmval s az alapeseti kvetkeztetssel ltalban bvebben a 10.7. alfejezet
foglalkozik.
314
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
A ler logika alapvet kvetkeztetsi feladata a rszvizsglat (subsumption) annak ellenrzse, hogy egy
kategria rsze-e egy msiknak a definciik alapjn s az osztlyozs (classification) annak ellenrzse,
hogy egy objektum egy kategriba tartozik-e. Bizonyos rendszerek egy kategriadefinci
konzisztenciavizsglatt (consistency) is tartalmazzk arra, hogy a tagsgi kritrium logikailag kielgthet-e.
A CLASSIC nyelv (Borgida s trsai, 1989) egy tipikus ler logika. A 10.11. bra mutatja a CLASSIC lersok
szintaxist (az rthetsg kedvrt a nyelv kulcsszavait magyar fordtsban adjuk meg a ford.).10 Azt az lltst
pldul, hogy az agglegnyek ntlen, felntt frfiak, kvetkezkppen rhatnnk le:
Agglegny = s(Ntlen, Felntt, Frfi)
Vegyk szre, hogy a ler logika hatkonyan teszi lehetv azt, hogy a prediktumokon direkt logikai
mveleteket hajtsunk vgre anlkl, hogy elszr mondatokat alkotnnk, amiket azutn sszekapcsolunk
ktszavakkal. Brmilyen lers a CLASSIC-ban kifejezhet elsrend logikval, de bizonyos lersok a
CLASSIC-ban sokkal vilgosabbak. Pldul az emberek egy olyan halmaznak lershoz, akiknek legalbb
hrom fiuk van, s a fik mind munkanlkliek, s a felesgeik orvosok, valamint maximum kt lnyuk van,
akik vagy fizika, vagy matematika tanszken professzorok, azt hasznlnnk, hogy:
s(Frfi, Legalbb(3, Fi), Legfeljebb(2, Lny),
Mind(Fi, s(Munkanlkli, Hzas, Mind(Felesg, Orvos))),
Mind(Lny, s(Professzor, Betlt(Tanszk, Fizika, Matematika))))
Vegyk szre, hogy a nyelv nem engedi meg annak lltst, hogy az egyik fogalom vagy kategria egy msiknak a rsze. Ez egy
tgondolt irnyvonal: a kategrik kztti rszviszonyt a kategrik bizonyos aspektusaibl kell tudni levezetni. Ha ez nem sikerl, akkor
valami hinyzik a lersbl.
11
A CLASSIC nyelv a gyakorlatban hatkony rszvizsglatot biztost, a legrosszabb eset azonban exponencilis futsidej.
10
315
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
ngy llts megfeleljvel, a count * from Tantrgy SQL-felkrs 4-es vlasszal tr vissza. Msfell egy
elsrend logikai rendszer vlasza az lenne, hogy egy s vgtelen kztt valahny, s nem ngy. Ennek
magyarzata, hogy a Tantrgy llts nem zrja ki, hogy ms, nem emltett tantrgyakat is fel lehessen venni, s
azt sem, hogy az emltett tantrgyak mind klnbzk.
A plda mutatja, hogy az adatbzisok s az emberi kommunikci konvencija az elsrend logiktl legalbb
kt aspektusban klnbzik. Elszr, az adatbzisok (s az emberek) felttelezik, hogy a megadott informci
teljes, vagyis hogy az igazknt ki nem jelentett rgztett atomi formulkrl felttelezhetjk, hogy hamisak. Ez az
n. zrt vilg felttelezs (closed-world assumption, CWA). Msodszor, elfogadjuk ltalban, hogy
klnbz nevek klnbz objektumokat jelentenek. Ez az n. egyedi elnevezsek felttelezs (unique
names assumption, UNA), amit a cselekvs-nevek kontextusban elszr a 10.3. alfejezetben vezettnk be.
Az elsrend logika e konvencikhoz nem folyamodik, gy preczebbnek kell lennie. Hogy kijelentsk, csak
ngy klnbz tantrgyat lehet vlasztani, azt kellene rni, hogy:
Tantrgy(d, n) [d, n] = [SZT, 101] [d, n] = [SZT, 102]
[d, n] = [SZT, 106] [d, n] = [VIM, 101] (10.3)
A (10.3) egyenletet a (10.2) lezrsnak12 (completion) nevezzk. A lezrs ltalban minden prediktumhoz
egy defincit, egy akkor s csak akkor lltst rendel hozz. Minden definciban mindegyik, a prediktumot
a fejben tartalmaz definit klzhoz egy diszjunkci fog tartozni. 13 A lezrst ltalnossgban az albbi mdon
szerkesztik meg:
1. Gyjtsk ki az ugyanolyan (P) prediktum nvvel s (n) aritssal rendelkez klzokat.
12
13
316
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
2. Minden klzt az n. Clark Norml Formra (Clark Normal Form) transzformljuk: cserljk a:
P(t1,, tn) Trzs
kifejezsre, ahol a vi-k az jonnan bevezetett vltozk s a wi-k az eredeti klz vltozi. Hasznljuk minden klz
esetn a vi vltozk ugyanazon halmazt. Eredmnyknt a:
P(v1,, vn) B1
.
.
.
P(v1,, vn) Bk
A Clark-lezrs egy pldjt szablyokat s rgztett tnyeket tartalmaz tudsbzis esetn a 10.12. brn
lthatjuk. Hogy hozzadhassuk az egyedi elnevezsek felttelezst is, egyszeren adjuk meg az azonossgi
relci Clark-lezrst, ahol csak azok az ismert tnyek, hogy SZT = SZT s 101 = 101 stb. Ennek
megvalstst gyakorlskppen meghagyjuk az olvasnak.
A zrt vilg felttelezs lehetv teszi, hogy megtalljuk egy relci minimlmodelljt (minimal model). Ez
azt jelenti, hogy a Tantrgy relcihoz a legkevesebb elemet tartalmaz modellt tallhatjuk meg. A (10.2)
egyenletben a Tantrgy minimlmodellje ngyelem, kevesebb mr ellentmondshoz vezet. Horn-klz
317
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
tudsbzisok esetn mindig ltezik egy egyrtelm minimlmodell. Jegyezzk meg, hogy az egyedi elnevezsek
felttelezs mellett ez az azonossgi relcira is vonatkozik: minden term csakis sajt magval azonos. Paradox
mdon ez azt jelenti, hogy a miniml modellek egyben maximlisak abban az rtelemben, hogy annyi
objektumot tartalmaznak, amennyi csak lehetsges.
Lehetsges egy Horn-program Clark-lezrst kpezni, majd a kvetkeztetsek levonsa vgett egy
ttelbizonytnak tadni. Hatkonyabb azonban ltalban egy olyan specilis rendeltets kvetkeztet gpet
hasznlni, mint amilyen a Prolog, amelynl a zrt vilg s az egyedi elnevezsek felttelezsek a kvetkeztetsi
mechanizmusba be vannak ptve.
Akik a zrt vilg felttelezshez folyamodnak, vatosan kell megvlasztaniuk az ltaluk hasznlt kvetkeztetst.
Egy npszmllsi adatbzisban pldul, sszer a zrt vilg felttelezst hasznlni, ha a kvetkeztets a
vrosok populcijrl trtnik, de nyilvn helytelen konklzi lenne elfogadni, hogy a jvben nem szletnek
gyerekek, csakis annak alapjn, hogy az adatbzis a jvbeli szletsi bejegyzseket nem tartalmazza. A zrt
vilg felttelezs az adatbzist teljess (complete) teszi abban az rtelemben, hogy minden atomi lekrdezsre
vagy pozitv, vagy negatv vlaszt kapunk. Ha valamely tnyllsrl (mint pldul a jvbeli szletsek) tnyleg
tudatlanok vagyunk, a zrt vilg felttelezst hasznlni nem szabad. Egy komplikltabb tudsreprezentcis
rendszerben a felhasznlnak esetleg szabad lenne specifiklni a zrt vilg felttelezs hasznlatt ler
szablyokat.
Az els szably azt mondja, hogy ha szmtgpben merevlemez-meghajtnk van, s ez nem SCSI, akkor IDEnek kell lennie. A msik szably azt mondja, hogy ha ez nem IDE, akkor SCSI-nek kell lennie. A harmadik azt
mondja, hogy az SCSI-meghajt ltezse egy SCSI-vezrlt ttelez fel, vgl a negyedik kijelenti, hogy tnyleg
van egy meghajt. Ennek a programnak kt minimlmodellje van:
M1 = {Meghajt, IDEmeghajt}
M2 = {Meghajt, SCSImeghajt, SCSIvezrl}
A minimlmodellek nem kpesek a negls mint kudarc-ot hasznl programok szndkolt szemantikjt
kifejezni. Tekintsk a kvetkez programot:
P not Q
Ennek kt minimlmodellje van: {P} s {Q}. Az elsrend logika szemszgbl van ennek rtelme, mivel a P
Q a P Q-val ekvivalens. A Prolog szemszgbl azonban aggdni kellene: Q soha nem jelenik meg a nyl
bal oldaln, hogyan lehet ht egy kvetkezmny?
Egy alternatva a stabil modell (stable model), ami egy olyan minimlmodell, ahol minden atomnak igazolsa
(justification) van, azaz ltezik hozz olyan szably, amelyben a fej az atom, s ahol a trzs minden literlja
318
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
kielgtett. Formlisan M egy H program egy stabil modellje, ha M a H az M-re vonatkoz redukltjnak
(reduct) egy egyrtelm minimlmodellje. Egy H program redukltjt gy definiljuk, hogy H-bl elszr
minden olyan szablyt trlnk, amely trzsben a not A literl szerepel, ahol A a modell rsze, majd a marad
szablyokban a negatv literlokat trljk. Mivel H redukltja most mr egy Horn-klz lista, egy egyrtelm
minimlmodellel kell rendelkeznie.
A P not Q redukltja a {P}-re nzve maga a {P}, aminek minimlmodellje {P}. gy {P} egy stabil modell. A
{Q}-ra vonatkoz redukci egy res program, aminek minimlmodellje {}. {Q} teht nem stabil modell, mert
Q-nak a (10.5) egyenletben nincs igazols. Egy msik plda a (10.4) redukltjra az M1-re nzve:
IDEmeghajt Meghajt
SCSIvezrl SCSImeghajt
Meghajt
Ennek minimlmodellje M1, gy M1 egy stabil modell. A vlaszhalmaz programozs (answer set
programming) a logikai programozsnak a negls mint kudarc-cal bvtett fajtja, amely gy mkdik, hogy a
logikai programot rgztett formba transzformlja, majd stabil modelleket (amelyeket vlaszhalmazoknak
answer sets is neveznek) keres, tletkalkulus modell-ellenrzsi technikkat felhasznlva. A vlaszhalmazprogramozs leszrmazottja teht mind a Prolognak, mind az olyan gyors tletkalkulus-beli kielgthetsgi
ttelbizonytknak, mint a WALKSAT. A vlaszhalmaz programozst sikerrel alkalmaztk tervksztsi
problmkra, hasonlan az tletkalkulus-beli kielgthetsgi ttelbizonytkhoz. A vlaszhalmaz-programozs
elnye ms tervksztkkel szemben a rugalmassga: a tervkszt opertorokat s a knyszereket logikai
programokkal fejezi ki, s gy azok nem ktdnek a konkrt tervksztsi formalizmus korltozott
formtumhoz. A vlaszhalmaz-programozs htrnya ugyanaz, mint minden tletkalkulus szint technik: ha
az univerzumban tl sok objektum ltezik, egy exponencilis lassulssal kell szmolnunk.
Emlkezznk vissza, hogy a monotonits megkveteli, hogy minden vonzatllts igaz maradjon, amikor a tudsbzishoz j lltsokat
adunk hozz. Azaz ha TB , akkor TB .
14
319
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
Ha azt mondjuk, hogy az Abnormlis1-et krl kell rni (circumscribed), a krlr kvetkeztet felttelezheti,
hogy Abnormlis1(x), hacsak az Abnormlis1(x)-et nem fogja igaznak tallni. Ez lehetv teszi, hogy a
Repl(Tweety) konklzit levonjuk a Madr(Tweety) premissza alapjn, azonban a konklzi csak addig igaz,
amg az Abnorml(Tweety)-t ki nem jelentjk.
A krlrst a modellpreferencia-logika (model preference logic) egy pldjnak is tekinthetjk. Az ilyen
logikkban egy llts vonzatrelciban van (alapeseti sttuson), ha igaz a tudsbzis minden preferlt
modelljben, ellenttben a klasszikus logika igazsgkvetelmnyvel, hogy minden modellben legyen igaz.
Krlrs esetben egy modell egy msiknl preferltabb, ha kevesebb abnormlis objektuma van. 15 Nzzk
meg, hogy ez az tlet hogyan mkdik szemantikus hlban fellp tbbszrs rklds esetn. A tbbszrs
rklds standard pldja az n. Nixon-gymnt.16 Az eredete az a megfigyels, hogy Richard Nixon egy
kvker vallsi szekthoz tartozott (s gy alapesetben pacifista) s republiknus is volt (s gy alapesetben ppen
nem pacifista). Ezt az albbi mdon rhatjuk fel:
Republiknus(Nixon) Kvker(Nixon)
Republiknus(x) Abnormlis2(x) Pacifista(x)
Kvker(x) Abnormlis3(x) Pacifista(x)
A szably jelentse, hogy ha a Madr(x) igaz, s ha a Repl(x) a tudsbzissal konzisztens, akkor a Repl(x)-et
alaprtelmezsben lekvetkeztethetjk. ltalnossgban egy alaprtelmezett szably formja a:
P : J1, , Jn/C
ahol P-t elfelttelnek, C-t konkluzinak s a Ji-ket igazolsoknak nevezik ha ezek kzl brmelyik
igazolhatan hamis, a konklzit levonni nem szabad. A C-ben s a Ji-ben elfordul minden vltoznak P-ben
is meg kell jelennie. A Nixon-gymnt pldjt alaprtelmezett logikban egy tnnyel s kt alaprtelmezett
szabllyal fejezhetjk ki:
Republiknus(Nixon) Kvker(Nixon)
Republiknus(x) : Pacifista(x)/ Pacifista(x)
Kvker(x) : Pacifista(x) /Pacifista(x)
A zrt vilg felttelezsnl egy modell egy msiknl preferltabb, ha kevesebb igaz atomja van azaz a preferlt modellek
minimlmodellek. A CWA s a definit klz tudsbzis kztt ltezik termszetes kapcsolat, mert az ilyen tudsbzisban az elrecsatolt
kvetkeztets rvn elrt fix pont az egyrtelm minimlmodell (4.2. szakasz - Elre- s htrafel lncolsrszben).
16
A gymnt elnevezs a kt ton fut rkldsi lnc grfszer alakjtl szrmazik. (A ford.)
15
320
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
1980 ta, amikor is a nemmonoton logikkat els zben javasoltk, igen nagy elrehalads trtnt a matematikai
tulajdonsguk megrtsben. A ksi 1990-es vektl kezdve a logikai programozson alapul gyakorlati
rendszerek gretesnek bizonyultak a tudsreprezentcis eszkzk szerepben. Vannak azonban mg meg nem
vlaszolt krdsek. gy pldul ha a gpkocsiknak ngy kerekk van hamis, mit is jelent, ha egy ilyen llts a
tudsbzis rsze? Milyen az alaprtelmezett szablyok egy j halmaza? Ha minden szablyrl kln-kln nem
tudjuk eldnteni, hogy a tudsbzisunkhoz tartozik-e, akkor igen komoly problmnk van a modularits
hinyval. Vgl, hogyan lehet alaprtelmezett sttussal rendelkez hiedelmeket a dntshozatalban
felhasznlni? Ez taln az alaprtelmezett kvetkeztets legnehezebb problmja. A dntsek sokszor
kompromiszszumokkal jrnak egytt, s gy szksg van klnbz cselekvsek eredmnyeknt megjelen
hiedelmek erssgt sszehasonltani. Azokban az esetekben, amikor ugyanilyen jelleg dntsket sokszor
hozunk meg, lehetsg addik, hogy az alaprtelmezett szablyokat kszb-valsznsgi lltsokknt
rtelmezzk. Pldul a fkjeim rendben vannak alaprtelmezett szably valjban azt jelenti, hogy annak a
valsznsge, hogy a fkjeim rendben vannak, feltve, hogy ms informcim nincs, elegenden magas ahhoz,
hogy az optimlis dnts szmomra az, hogy induljak tnak a fkek ellenrzse nlkl. Amikor a dnts
kontextusa megvltozik pldul amikor egy slyosan megrakott teherkocsit vezetnk egy lejts hegyi ton ,
az alaprtelmezett szably hirtelen alkalmatlann vlik, akkor is, ha semmilyen j evidencink nincs, ami azt
sugalln, hogy a fkek hibsak. Az ilyen mrlegelsek nhny kutatt arra vezettek, hogy mrlegeljk, hogyan
gyazzk be az alaprtelmezett kvetkeztetst a valsznsg-elmletbe.
8. Igazsg-karbantart rendszerek
Az elbbi rszben arrl rveltnk, hogy egy tudsreprezentcis rendszer ltal levont sok kvetkeztetsnek
csupn alaprtelmezett s nem tkletesen biztos sttusa lehet. Az ilyen kikvetkeztetett konklzikbl nhny
szksgszeren hibsnak fog bizonyulni, s j informci fnyben vissza kell vonnunk. Ez a hiedelemrevzi
(belief revision) folyamata.17 Tegyk fel, hogy a tudsbzis tartalmazza P lltst az elrecsatolt algoritmussal
levont alaprtelmezett konklzit vagy egyszeren egy hibs felttelezst , s szndkunkban ll vgrehajtani
az LLT (TB, P)-t. Hogy az ellentmondst elkerljk, elszr vgre kell hajtani a VISSZAVON (TB, P)-t. Ez
elg egyszernek tnik. Problma akkor jelentkezik, ha P-bl tovbbi lltsokat kvetkeztettnk le s
jegyeztnk fel a tudsbzisba. A P Q implikcit pldul felhasznltuk a Q tudsbzishoz val
hozzadshoz. A nyilvnval megolds a P-bl kikvetkeztetett sszes llts visszavonsa kudarcba fut,
mert ilyen lltsoknak P-n tlmenen ms igazolsuk is lehet. Ha R s R Q is bekerlt a tudsbzisba, akkor
Q-t mgsem kell eltvoltanunk. Az igazsg-karbantart rendszereket (truth maintenance systems) ilyen
bonyodalmakat kezelsre terveztk.
Az igazsg-karbantarts egyszer mdja, hogy nyomon kvetjk, ahogyan sorban hozzadjuk a mondatokat a
tudsbzishoz, a mondatok P1-tl Pn-ig trtn megszmozsval. Amikor a VISSZAVON (TB, Pi) hvs
megtrtnik, a rendszert a Pi hozzadsa eltti llapotba lltjuk vissza, a Pi-t s a Pi-bl levont sszes
kvetkeztetst visszavonva. Ha szksges, akkor a Pi+1 s a Pn kztti mondatok ismt hozzadhatk. Ez
egyszer megolds, s garantlja, hogy a tudsbzis konzisztens lesz, de azt jelenti, hogy a Pi visszavonsa n i
llts visszavonst s jbli kijelentst, valamint ezen lltsokbl trtn kvetkeztetsek visszavonst s
jbli lefuttatst ignyli. Olyan rendszerekben, ahol sok tny kerl hozzadsra, az ilyen megolds nem
praktikus.
Hatkonyabb megkzelts az igazolsalap igazsg-karbantart rendszer vagy JTMS (justification-based
truth maintenance system). Egy JTMS-ben a tudsbzis minden mondatt olyan igazolssal (justification)
ltjk el, amely meghatrozza azokat a mondatokat, amelyekbl lekvetkeztettk azokat. Pldul ha a tudsbzis
mr tartalmazza a P Q-t, akkor az LLT (P) hatsra a Q-t hozzadjuk, az {P, P Q} igazolssal.
ltalnossgban bizonyos mondatoknak egynl tbb igazolsa lehet. Az igazolsok felhasznlhatk hatkony
visszavonsokra. A VISSZAVON (P) hvst kveten, a JTMS pontosan azokat a mondatokat fogja a
tudsbzisbl eltvoltani, amelyeknl P minden igazols rsze. gy, ha egy Q mondatnak a {P, P Q} lenne az
egyetlen igazolsa, akkor trldne; ha az {P, P R Q} igazolsa is ltezne, mg mindig visszavonsra
kerlne, de ha az {R, P R Q} igazolsa is ltezne, akkor megmaradna. Ily mdon a P visszavonshoz
szksges id csakis azon mlik, hogy P-bl hny lltst vezettnk le, s nem azon, hogy P hozzadsa utn
hny llts kerlt mg be a tudsbzisba.
A hiedelemrevzit sokszor a hiedelemfrisstssel (belief update) lltjk szembe, amelyrl akkor van sz, amikor a tudsbzis inkbb a
vilgbeli vltozsok hatsra, s nem a rgztett vilgrl befut j informci hatsra kerl fellvizsglsra. A hiedelemfrissts
sszekapcsolja a hiedelemrevzit az idre s a vltozsra vonatkoz kvetkeztetssel. Kapcsolatban ll a 15. fejezetben lert szrs
(filtering) folyamatval.
17
321
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
A JTMS felttelezi, hogy az egyszer figyelembe vett mondatokat mskor is hasznlni fogjuk, gy ahelyett, hogy
trlnnk a tudsbzisbl, amikor elvesztik az sszes igazolst, csak megjelljk ket, mint kintlevket. Ha egy
ksbbi llts visszalltja az igazolsok egyikt, akkor a mondat ismt bentlev jellst kap. Ily mdon a
JTMS megtartja a hasznlt sszes kvetkeztetsi lncot, s nem kell jra lekvetkeztetnie azokat a mondatokat,
amelyek igazolsa ismt rvnyess vlik.
Azon tl, hogy a TMSek a hibs informcit visszavonjk, felhasznlhatk a tbbszrs hipotetikus helyzet
elemzsnek a felgyorstshoz is. Tegyk fel, hogy a Romn Olimpiai Bizottsg helyszneket keres a 2048-ban
Romniban megrendezend olimpiai jtkokhoz az sz, a knnyatltikai s a lovas versenyszmok szmra.
Legyen az els hipotzis a kvetkez: Helyszn(szs, Piteti), Helyszn(Knnyatltika, Bukarest) s
Helyszn(Lovasverseny, Arad). A vlaszts logisztikai kvetkezmnyeinek kidertshez, s gy a helysznek
kvnatossgnak meghatrozshoz igen sok kvetkeztets szksges. Ha figyelembe akarjuk venni a
Helyszn(Knnyatltika, Nagyszeben)-t, a TMS elkerli annak a szksgessgt, hogy jra nullbl induljunk
ki. Egyszeren viszavonjuk a Helyszn(Knnyatltika, Bukarest)-t, s hozzadjuk a Helyszn(Knnyatltika,
Nagyszeben)-t, s a TMS a szksges revzikat magra vllalja. A Bukarestre vonatkoz kvetkeztetsi lncok
Nagyszeben esetn jrafelhasznlhatk, feltve, hogy a konklzik ugyanazok lesznek.
Egy felttelezsalap igazsg-karbantart rendszert (assumption-based truth maintenance system,
ATMS) arra terveztek, hogy ezt a fajta hipotetikus vilgok kztti kontextustkapcsolst kifejezetten
hatkonny tegye. Egy JTMS-ben az igazolsok karbantartsa lehetv teszi, hogy az egyik llapotbl gyorsan
egy msikba lpjnk t nhny visszavonssal s kijelentssel, de minden idpillanatban csak egyetlen llapotot
reprezentlunk. Egy ATMS az sszes llapotot egyszerre reprezentlja, amivel valaha is foglalkoztunk. Mg egy
JTMS egyszeren bent- vagy kintlevnek jelli a mondatokat, egy ATMS nyomon kveti, minden egyes
mondatra, hogy a mondatot mely felttelezsek tennk igazz. Ms szavakkal minden egyes mondatnak van egy
cmkje, amely a felttelezs halmazokat tartalmaz halmazbl ll. A mondat csak azon esetben ll fenn, amikor
egy felttelezs halmaz sszes felttelezse fennll.
Az igazsg-karbantart rendszerek mechanizmust biztostanak magyarzatok (explanations) generlshoz is.
Technikailag, P mondat magyarzatt olyan E mondatok halmazval definiljuk, melyekre E maga utn vonja
P-t. Ha E mondatai igazak, akkor E egyszeren P igazolshoz egy szksgszer alap. Azonban a magyarzat
rszei lehetnek felttelezsek (assumptions) is olyan lltsok, amelyek nem igazak, de ha igazak lennnek,
elegendk lennnek P igazolshoz. Lehetsges pldul, hogy nincs elg tny bebizonytani, hogy az aut nem
fog indulni, de egy j magyarzat rsze lehet az elromlott akkumultor. Ez, sszekapcsolva a gpkocsik
mkdsre vonatkoz tudssal, elegend, hogy a megfigyelt jelensget megmagyarzza. Az esetek
tbbsgben egy minimlis E magyarzatot fogunk preferlni, azaz olyan magyarzatot, amelynek nincs olyan
megfelel rszhalmaza, amelyik szintn egy magyarzat lenne. Egy ATMS a gpkocsi nem indul
problmhoz magyarzatokat generl azltal, hogy tetszleges sorrendben felttelezseket tesz (mint pldul
benzin a tankban vagy hibs az akkumultor), akkor is, ha azok egy rsze ellentmondsos. Elg majd a
gpkocsi nem indul llts cmkjt megnzni, hogy az lltst igazol felttelezsek halmazt megismerjk.
Az igazsg-karbantart rendszereket megvalst algoritmusok egy kicsit komplikltak, s itt nem trgyaljuk
ket. Az igazsg-karbantartsi problma komplexitsa legalbb olyan nagy, mint az tletlogikai kvetkeztets
azaz NP-teljes. Ezrt nem vrhat el az, hogy az igazsg-karbantarts csodaszer legyen. Ugyanakkor, ha
krltekinten hasznljk, a TMS-rendszer lnyegesen javthat egy logikai rendszer komplex krnyezeteket s
hipotziseket kezel kpessgn.
9. sszefoglals
Ez a fejezet eddig a knyv legrszletesebb fejezete. Azzal, hogy sokfle tuds reprezentlsnak rszleteivel
foglalkozunk, remlheten rzkeltetni tudtuk az olvasval, hogy hogyan hozhatk ltre valdi tudsbzisok. A
lnyegi tmk az albbiak:
Nagymret tudsreprezentci egy ltalnos rendeltets ontolgit ignyel, a specifikus problmaterletek
szervezshez s az egymssal val sszekapcsolshoz.
Egy ltalnos ontolginak a tuds szles vlasztkt kell lefednie, s elvben kpesnek kell lennie brmilyen
problmaterlet kezelsre.
Bemutattunk egy fels ontolgit (upper ontology), amely a kategrikon s az esemnykalkuluson alapul.
Foglalkoztunk strukturlt objektumokkal, az idvel s a trrel, a vltozssal, folyamatokkal, szubsztancikkal
s hiedelmekkel.
322
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
A szanszkrit nyelv tbb vltozata kzl a ssztrai szanszkrit a valls s a tudomny nyelve. (A ford.)
323
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
fajtkkal s a pontatlan kategriahatrokkal kapcsolatos problmkkal tbbek kzt Wittgenstein, Quine, Lakoff
s Schwartz foglalkozott (Wittgenstein, 1953; Quine, 1953; Lakoff, 1987; Schwartz, 1977).
Az rdeklds a nagymret ontolgik irnt nvekszik. A CYC projekt (Lenat, 1995; Lenat s Guha, 1990)
kapcsn egy kb. 60 000 tnyt s 6000 fogalmat tartalmaz fels ontolgit hoztak nyilvnossgra, s egy sokkal
nagyobb globlis ontolgit szabadalmaztattak. Az IEEE ltrehozta a P1600.1 albizottsgot a Standard Upper
Ontology Working Groupot, az Open Mind Initiative viszont tbb mint 7000 internetfelhasznlt krt fel, hogy
tbb mint 400 000 tnyt vigyenek be kzhasznlat fogalmakrl. A weben alakulban vannak az olyan
standardok, mint az RDF, az XML s a szemantikus hl (Berners-Lee s trsai, 2001), mbr azokat mg nem
hasznljk szles krben. A Formal Ontology in Information Systems (FOIS) konferencikon sok rdekes cikket
publiklnak mind terletspecifikus, mind ltalnos ontolgikrl.
A jelen fejezetben kialaktott taxonmia a szerzktl szrmazik, s rszben azokon a tapasztalatokon alapul,
melyeket a CYC projektbl nyertek, rszben Hwang, Schubert s Davis munkjra tmaszkodva (Hwang s
Schubert, 1993; Davis, 1990). Jzan sz reprezentcis projekt inspirl viti Hayes The Naive Physics
Manifestjban jelentek meg (Hayes, 1978; 1985b).
Az idt, a vltozst, a cselekvseket s az esemnyeket mind az MI-ben, mind a filozfiban s az elmleti
szmtstudomnyban intenzven tanulmnyoztk. A legrgebbi megkzelts a temporlis logika (temporal
logic), ami egy specilizlt logika, ahol minden modell egy teljes trajektrit r le az (ltalban lineris vagy
elgaz) idben, a statikus relcis struktrk helyett. A logika modlis opertorokat (modal operators)
tartalmaz, amelyeket lltsokra alkalmaznak. A p azt jelenti, hogy p a jvben minden pillanatban igaz lesz,
a p pedig azt, hogy p a jvben valamikor igaz lesz. A temporlis logika tanulmnyozst az kori
Grgorszgban Arisztotelsz, valamint a Megara s a sztoikus iskola kezdemnyezte. A modern idkben
elsnek Findlay vetette fel az idrl val kvetkeztets formlis kalkulusnak a gondolatt (Findlay, 1941),
azonban a legnagyobb hatsnak Arthur Prior munkssga szmt (Prior, 1967). J tanknyvek Rescher s
Urquhart, valamint van Benthem munki (Rescher s Urquhart, 1971; van Benthem, 1983).
Az elmleti szmtstudomny kutati rgta rdekldtek az irnt, hogy szmtsi cselekvsek szekvencijaknt
rtelmezett programok tulajdonsgait hogyan lehetne formalizlni. A modlis logikt szmtgpes
programokrl val kvetkeztetsre Burstall vezette be (Burstall, 1974). Rvidesen utna Vaughan Pratt a
dinamikus logikt (dynamic logic) dolgozta ki (Pratt, 1976), amelyben a modlis opertorok programok vagy
ms cselekvsek hatst jelzik (lsd mg Harel, 1984). gy pldul ha dinamikus logikban egy program neve,
akkor [] p azt jelenti, hogy p igaz lesz a vilg minden olyan llapotban, amely az programnak a jelenlegi
llapotbl val indtsbl szrmazik. Az p pedig azt jelenti, hogy p igaz lesz a vilg legalbb egy
olyan llapotban, amely az program mostani llapotbl val indtsbl szrmazik. Programok konkrt
elemzsre a dinamikus logikt Fischer s Ladner hasznlta (Fischer s Ladner, 1977). Pnueli programokrl
val kvetkeztetsre klasszikus temporlis logikt javasolt (Pnueli, 1977).
A temporlis logikban az idt ltalban a nyelv modellelmletbe gyazzk be. Az MI-ben a tendencia az volt,
hogy az idpontokra s az esemnyekre vonatkoz aximkat explicit mdon a tudsbzisban rjuk fel, anlkl
hogy az idnek a logikban valamilyen specilis sttust adnnk. Az ilyen megkzelts egyes esetekben
nagyobb rugalmassgot s ttekinthetsget biztost. Radsul az elsrend logikban kifejezett temporlis
logika nagyobb esllyel integrlhat az ebben a formalizmusban felhalmozott ms tudsanyaggal.
Az MI-ben az id s a cselekvs legkorbbi kezel appartusa John McCarthy szitucikalkulusa volt
(McCarthy, 1963). A QA3 volt az els MI-rendszer, amely nagyban felhasznlta a cselekvsre vonatkoz
ltalnos rendeltets elsrend logikai kvetkeztetst (Green, 1969b). Kowalski fejlesztette ki az lltsok
reifiklst a szitucikalkuluson bell (Kowalski, 1979b).
A keretproblmt, mint olyant, elsknt McCarthy s Hayes ismertk fel (McCarthy s Hayes, 1969). Szmos
kutat a problmt megoldhatatlannak tartotta az elsrend logikn bell, s ez intenzv kutatshoz vezetett a
nemmonoton logikk irnyba. A filozfusok Dreyfustl (Dreyfus, 1972) Crockettig (Crockett, 1994) a
keretproblmt az egsz MI-vllalkozs szksgszer kudarca egyik tnetnek tartottk. A reprezentcis
keretproblma rszleges megoldsa kvet-llapot aximk segtsgvel Ray Reitertl szrmazik (Reiter, 1991).
A kvetkeztetsi keretproblma megoldsa Holldobler s Schneeberger munkjra vezethet vissza (Holldobler
s Schneeberger, 1990), amit most foly esemny kalkulusnak neveznk (Thielscher, 1999). Jelen fejezetben
bemutatott elemzs Lin s Reiter, valamint Thielscher elemzsein alapul (Lin s Reiter, 1997; Thielscher, 1999).
A szitucikalkulusban a cselekvsrl val kvetkeztets teljes, korszer trgyalst Shanahan s Reiter
knyvei adjk (Shanahan, 1997; Reiter, 2001b).
324
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
Tudsbzis reprezentci
Arisztotelsz Kategrik c. mvhez kommentrt fzve Porfiriusz grg filozfus (kb. i. e. 234305) rajzolt fel
valamit, amit els szemantikus hlnak lehetne minsteni. Charles S. Peirce korszer logikra alapozva
egzisztencilis grfokat fejlesztett ki, mintegy kifejlesztve az els modern logikt hasznl szemantikus hl
formalizmust (Peirce, 1909). Az MI-n bell a szemantikus hlk kutatst Ross Quillian kezdemnyezte
(Quillian, 1961), a nyelvfeldolgozs s az emberi memria irnti rdekldsbl kiindulva. Marvin Minsky
nagy hats cikkben a szemantikus hlk kereteknek (frames) nevezett vltozatt mutatta be (Minsky, 1975).
A keret egy objektum vagy egy kategria reprezentcija ms objektumokkal vagy kategrikkal kpzett
relciival. Br a cikk rdekldst keltett magnak a tudsreprezentcinak a terlete irnt, mgis kritizltk,
hogy a Minsky cikkt megelz objektumorientlt programozs eszkzeit, illetve az rklds s az
alaprtelmezett rtkek hasznlatt jbl felknlja (Dahl s trsai, 1970; Birtwistle s trsai, 1973). Nem
vilgos, hogy az objektumorientlt programozsrl szl ksbbi cikkeket viszonzskppen mennyire
befolysolta a szemantikus hlkkal kapcsolatos korai MI-munka.
A szemantika krdse klnsen lesen merl fel Quillan szemantikus hljval kapcsolatban (s mindazokkal
kapcsolatban, akik Quillan megkzeltst kvettk), a szemantikus hlban mindentt jelen lev s nagyon
bizonytalan ISA-kapcsolatok, valamint egyb korai tudsreprezentcis formalizmusok mint amilyenek
MERLIN (Moore s Newell, 1973) misztikus lapos s fedi opercii miatt. Az MI-kutatk figyelmt
Woods hres Whats In a Link? c. cikke irnytotta a precz szemantika kialaktsnak szksgessgre a
tudsreprezentcis formalizmusban (Woods, 1975). Brachman dolgozta fel ezt a tmt s a problmra
megoldsokat is javasolt (Brachman, 1979). Patrick Hayes The Logic of Frames c. cikke mg mlyebbre vgott
azt lltva, hogy a keret formalizmusnak tbbsge nem ms, mint egy j szintaktika az elsrend logika egy
rszre (Hayes, 1979). Drew McDermott Tarskian Semantics, or, No Notation Without Denotation! c. cikkben
amellett rvelt, hogy az elsrend logika modellalap szemantikjt kell alkalmazni mindenfle
tudsreprezentcis formalizmus esetben (McDermott, 1978b). Ez vitatott krds maradt. Megemltend, hogy
McDermott maga is fellvizsglta llspontjt A Critique of Pure Reason (McDermott, 1987) c. cikkben. A
NETL (Fahlman, 1979) egy kifinomult szemantikus hl rendszer volt, melynek ISA-kapcsolatai (amit virtulis
msolsnak virtual copy , azaz VC-kapcsolatnak hvtak) sokkal inkbb a keretrendszerek vagy az
objektumorientlt programozsi nyelvek rklds jellemvonsnak jellsn alapult, mint a
rszhalmazkapcsolaton, s sokkal pontosabban volt definilva, mint Quillian kapcsolatai a Woods eltti idkbl.
A NETL klnsen rdekes, mivel prhuzamos hardveren szndkoztak megvalstani, hogy gy lekzdhessk a
nagy szemantikus hlkbl trtn informci-visszakeress problmjt. David Touretzky az rkldst
rigorzus matematikai analzisnek vetette al (Touretzky, 1986). Selman s Levesque a kivtelekkel kiegsztett
rklds komplexitst taglalja, megmutatva, hogy ez a legtbb formalizmusban NP-teljes (Selman s
Levesque, 1993).
A ler logikk fejldse csupn egy hossz kutatsi folyamat jelenlegi llsa, mely az elsrend logika olyan
hasznlhat rszhalmazainak megtallst clozza, melyekre a kvetkeztets szmtstechnikai alapon
kezelhet. Hector Levesque s Ron Brachman megmutattk, hogy bizonyos logikai konstrukcik, pldul a
diszjunkci s a negls bizonyos hasznlata felels elsdlegesen a logikai kvetkeztets kezelhetetlensgrt
(Levesque s Brachman, 1987). A KL-ONE rendszerre (Schmolze s Lipkis, 1983) alapozva szmos olyan
rendszert fejlesztettek ki, melyek tervezse magban foglalta az elmleti komplexitsanalzis eredmnyeit.
Leginkbb emltsre mlt ilyen rendszerek a KRYPTON (Brachman s trsai, 1983) s a CLASSIC (Borgida s
trsai, 1989). Az eredmny a kvetkeztets sebessgnek lnyeges nvekedse lett, s a kvetkeztet rendszerek
komplexitsa s kifejezkszsge kztti hatsok sokkal jobb megismerse. A kutatsok llst Calvanese
foglalta ssze (Calvanese s trsai, 1999). Ms rszrl, ahogy Doyle s Patil rvelnek, egy nyelv
kifejezkszsgnek korltozsa vagy lehetetlenn teszi bizonyos problmk megoldst, vagy a nyelv nem
logikai eszkzkkel trtn kitgtsra sztnz (Doyle s Patil, 1991).
A nemmonoton kvetkeztets mind a hrom f formalizmust a krlrst (McCarthy, 1980), az
alaprtelmezett logikt (Reiter, 1980) s a modlis nemmonoton logikt (McDermott s Doyle, 1980) az AI
Journal egyetlen klnszmban publikltk. A vlaszhalmaz-programozst a negls mint kudarc
kiterjesztsnek vagy a krlrs finomtsnak lehet nzni. A mgtte lv stabil modell szemantikt Gelfond
s Lifschitz vezettk be (Gelfond s Lifschitz, 1988). A vezet vlaszhalmaz-programozsi rendszerek a DVL
(Eiter s trsai, 1998) s SMODELS (Niemel s trsai, 2000). A diszkmeghajt plda a SMODELS felhasznli
kziknyvbl szrmazik (Syrjnen, 2000). A vlaszhalmazprogramozs hasznlatt a tervkszts szmra
Lifschitz trgyalja (Lifschitz, 2001). A nemmonoton logika klnbz megkzeltseirl j ttekintst ad
Brewka (Brewka s trsai, 1997). A logikai programozs negls mint kudarc megkzeltsvel s a Clarklezrssal Clark foglalkozik (Clark, 1978). Van Emden s Kowalski azt mutattk ki, hogy minden negls
nlkli Prolog programnak ltezik egyrtelm minimlmodellje. Az utbbi vekben tani lehetnk, ahogy
nvekszik az rdeklds a nemmonoton logika nagymret tudsreprezentcis rendszerekben val alkalmazsa
326
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
irnt. Egy nemmonoton rkldsi rendszer els sikeres kereskedelmi alkalmazsa taln a BENINQ rendszerek
volt a biztostsi felttelek megtudakolshoz (Morgenstern, 1998). A Logic Programming and Nonmonoton
Reasoning (LPNMR) konferencik kiadvnyai sok klnbz, logikai programozson alapul nemmonoton
kvetkeztet rendszerrl szmolnak be.
Az igazsg-karbantart rendszerek tanulmnyozsa TMS (Doyle, 1979) s RUP rendszerekkel (McAllester,
1980) kezddtt, mindkett alapveten JTMS-rendszer volt. Az ATMS megkzeltst Johan de Kleer cikkeinek
sorozata rta le (De Kleer, 1986c; 1986a; 1986b). A Building Problem Solvers (Forbus s De Kleer, 1993)
rszletesen elmagyarzza, hogyan hasznlhatk a TMS-ek MI-alkalmazsokban. Nayak s Williams
megmutatjk, hogy egy hatkony TMS hogyan teszi lehetv, hogy a NASA-rhajk mveleteit vals idben
megtervezhessk (Nayak s Williams, 1997).
Nyilvnval okoknl fogva a jelen fejezet a tudsreprezentci minden terletvel elmlylten nem foglalkozik.
A hrom f kihagyott tmakr az albbi:
Kvalitatv fizika (qualitative physics): A tudsreprezentci egy olyan rszterlete, amely specilisan a
fizikai objektumok s folyamatok logikai nemnumerikus elmletnek megkonstrulsval foglalkozik. A
kvalitatv fizika elnevezst Johan de Kleer alkotta meg (de Kleer, 1975), br llthat, hogy a kutats Fahlman
BUILD rendszervel indult meg (Fahlman, 1974). A BUILD egy komplex tervkszt rendszer volt, bonyolult
kockatornyok ptshez. Fejlesztse sorn Fahlman szrevette, hogy az erfesztsek zme (becslse szerint
80%-a) nem magra a tervksztsre fordtdott, hanem a klnbz kocka rszstruktrk stabilitsnak
eldntsre. Fahlman egy hipotetikus naiv fizikai jelleg folyamatot vzol, hogy megmagyarzza, mirt
kpesek a kisgyerekek BUILD-szer problmkat megoldani a BUILD-del vgzett fizikai modellezsnl
hasznlt, nagy sebessg lebegpontos aritmetika nlkl. Hayes a trtnetek a tr-id 4-dimenzij,
Davidson esemnyeire hasonlt szeletei felhasznlsval megalkotja a folyadkok igen bonyolult naiv
fizikjt (Hayes, 1985a). Hayes volt az els, aki bebizonytotta, hogy ha egy csapbl folyamatosan folyik a
vz, mikzben a lefolyt bedugaszoljuk, a kd vgl tlcsordul, s azt is, hogy aki beleesik a tba, az teljesen
elzik. De Kleer s Brown, valamint Ken Forbus megksreltk a vilg egyfajta, a fizikai egyenletek
kvalitatv absztrakcijn alapul ltalnos rendeltets elmletnek a fellltst (De Kleer s Brown, 1985;
Forbus, 1985). Az utbbi idben a kvalitatv fizika eljutott addig a pontig, ahol mr lehetsges a komplex
fizikai rendszerek szles vlasztknak az elemzse (Sacks es Joskowicz, 1993; Yip, 1991). Kvalitatv
technikkat hasznltak teljesen j tervezs rk, szlvdtrlk s hatlb stlrobotok
megkonstrulshoz is (Subramanian, 1993; Subramanian s Wang, 1994). A terlethez j bevezet
olvasmny a Readings in Qualitative Reasoning about Physical Systems c. gyjtemny (Weld s De Kleer,
1990).
Trbeli kvetkeztets (spatial reasoning): A wumpus s a bevsrl vilgban a naviglshoz szksges
kvetkeztets trivilis a valdi vilg gazdag trbeli struktrjhoz kpest. A trrl trtn jzan sz
kvetkeztets legteljesebb ksrlete Ernest Davis (Davis, 1986; 1990) munkjban tallhat. Cohn
rgikapcsoldsi kalkulusa (Cohn s trsai, 1997) az alapja az egyfajta kvalitatv trbeli kvetkeztetsnek,
ami elvezetett a fldrajzi informcis rendszerek j fajtihoz. A kvalitatv fizikhoz hasonlan, gy tnik,
hogy egy gens sokig elboldogul egy teljes metrikus reprezentci hasznlata nlkl. Ha egy ilyen
reprezentcira van szksg, hasznlhatk a robotikban kifejlesztett megoldsok (lsd 25. fejezet).
Pszicholgiai kvetkeztets (psychological reasoning): A pszicholgiai kvetkeztets magban foglalja egy
mkdkpes pszicholgia kifejlesztst a mestersges gensek szmra, hogy az gensek kpesek legyenek
sajt magukra s ms gensekre vonatkoz kvetkeztetseket meghozni. Ennek gyakran az n. npi
pszicholgia (folk psychology) az alapja, amely egy olyan elmlet, amirl azt gondoljuk, hogy az emberek
sajt maguk s msok megtlsben hasznljk. Amikor az MI-kutatk mestersges genseiket ms
gensekre vonatkoz kvetkeztetst tmogat pszicholgiai elmletekkel ltjk el, ezen elmletek alapja
gyakran a logikai gens rendszertervnek a kutat ltal megfogalmazott lersa. A pszicholgiai kvetkeztets
pillanatnyilag a termszetes nyelv megrtsnek kontextusn bell a leghasznosabb, ahol elsdleges
fontossg a beszl intencijt megjsolni.
Az ezen a terleten foly munkk legfrissebb forrst a Principles of Knowledge Representation and Reasoning
nemzetkzi konferencik kiadvnyai jelentik. A Readings in Knowledge Representation (Brachman s
Levesque, 1985) s a Formal Theories of the Commonsense World (Hobbs s Moore, 1985) a
tudsreprezentci kivl antolgii. Az elbbi a reprezentcis nyelvek s formalizmusok trtnelmileg fontos
publikciira sszpontost, az utbbi pedig magnak a tudsnak az akkumullsra helyezi a hangslyt. Davis,
Stefik s Sowa knyvei j bevezet munkk a tudsreprezentcikhoz (Davis, 1990; Stefik, 1995; Sowa, 1999).
327
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
9.2. Feladatok
10.1.
rja fel a wumpusvilg-beli Lj cselekvs hatst ler lltsokat. rja le a wumpusra kifejtett hatst, s ne
felejtse, hogy a lvshez az gensnek nylra van szksge.
10.2.
A szitucikalkuluson bell fogalmazzon meg egy olyan aximt, amelyben a 0. idpillanatot az S0 szitucival
kapcsolja ssze, valamint egy olyan msik aximt, ahol a t idpillanatot az S0-bl a t szm cselekvs
szekvencijval ellltott szitucival kapcsolja ssze.
10.3.
Ebben a feladatban egy t megtervezsvel foglalkozunk egy robot szmra, kt vros kztt. A robot
alapcselekvse a Megy(x, y), mely rvn az x vrosbl az y vrosba kerl t, ha a kt vros kztt ltezik
kzvetlen t. A Kzvetlent(x, y) akkor s csak akkor igaz, ha az x s az y kztt ltezik egy kzvetlen
tszakasz. Felttelezhetjk, hogy az ilyen tnyek a rendszer tudsbzisba mr bekerltek (1.2. szakasz - A
problmk megfogalmazsa rszben lv trkpet). A robot Aradnl kezd, s Bukarestet kell elrnie.
a. Adja meg robot kezd llapotnak egy alkalmas logikai lerst.
b. rjon fel egy alkalmas logikai krdst, amelynek megoldsai megadjk a clhoz vezet lehetsges utakat.
c. rja fel a Megy cselekvst ler logikai lltst.
d. Tegyk most fel, hogy kt vros kztt a kzvetlen t kvetse a kzvetlen t hosszval arnyos zemanyagfogyasztst jelent. A robot teli tankkal indul. Bvtse reprezentcijt, hogy ezek a szempontok helyet
kapjanak benne. A cselekvs lersnak olyannak kell lennie, hogy az elbb megfogalmazott krds
megvlaszolsnak tovbbra is a lehetsges terveket kell megadnia.
e. rja le a kezdeti szitucit, s adja meg a Megy cselekvst ler j szablyt, illetve szablyokat.
f. Tegyk most fel, hogy a csompontok nmelyike benzinkt is egyben, ahol a robot az zemanyagtankjt
teletltheti. Bvtse ennek megfelelen a reprezentcijt, s rja fel a benzinkutak lershoz szksges j
szablyokat, a TeleTlt cselekvst is belertve.
10.4.
Olvasnival. Vizsglja meg annak a lehetsgt, hogy az esemnykalkulust az egyidej esemnyek kezelsvel
bvthesse. Elkerlhet-e az aximk kombinatorikus robbansa?
10.5.
A fejezetben kifejlesztett reprezentcit felhasznlva s kiterjesztve adja meg az albbi hat llts
reprezentcijt.
a. 0 C s 100 C kztt cseppfolys a vz.
b. A vz 100 C-nl forr fel.
c. Jnos palackjban megfagyott a vz.
d. Az svnyvz egyfajta vz.
e. Jnos palackjban svnyvz van.
f. Minden folyadknak van fagysi pontja.
g. Egy liter vz slya tbb, mint egy liter alkohol slya.
328
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
Ismtelje meg a feladatot mereolgiai megkzeltsen alapul reprezentcit felhasznlva, amelyben pldul a
Vz egy objektum, amely a vilg minden vizt, mint az objektum rszt tartalmazza.
10.6.
rja fel a:
a. KimertRszFeloszts
b. RszPartci
c. PronkntKlcsnsenKizr
defincijt a KimertFeloszts, a Partci s a KlcsnsenKizr defincijval analg mdon. Igaz-e, hogy
RszPartci(s, Ktege(s))? Ha igen, bizonytsa be, ha nem, adjon meg egy ellenpldt, s definiljon elgsges
feltteleket, amelyek mellett igaz lesz.
10.7.
rjon fel egy olyan lltshalmazt, amely lehetv teszi a klnll paradicsomok (vagy ms objektumok)
rmegllaptst, ha adott a kilnknti r. Az elmlet kiterjesztsvel tegye lehetv egy zacsk paradicsom
rnak a kiszmtst.
10.8.
Mrtkeket reprezentl alternatv smban az egysgfggvnyeket egy absztrakt hosszsg objektumra
alkalmazzuk. Az ilyen smban azt lehetne rni, hogy: Centimterek(Hossz(L1)) = 15. Hogyan viszonyul ez a
sma a fejezetbelihez? A szempontok tbbek kztt az tvltsi aximk, az absztrakt mennyisgek elnevezsei
(mint pldul ezer forint) s az eltr egysgekben kifejezett absztrakt mrsek sszehasonltsa (50 hvelyk
tbb, mint 50 cm).
10.9.
Konstruljon a valutk tvltsi rfolyamra egy olyan reprezentcit, amely lehetv teszi a napi fluktucik
figyelembevtelt.
10.10.
Ebben a feladatban az esemnykategrik s azon idintervallumok kztti relcikkal foglalkozunk,
amelyekben az esemnyek megtrtnnek.
a. Definilja a T(c, i) prediktumot a Kzben s a segtsgvel.
b. Adja meg a precz magyarzatt annak, hogy a konjunktv esemnykategria lersnl mirt nincs szksg a
ktfle jellsmdra.
c. Adja meg a T(Egyik(p, q), i) s a T(VagyVagy(p, q), i) formlis defincijt.
d. Magyarzza meg, mirt rtelmes a ktfajta diszjunkcival analg mdon az esemnyek ktfajta neglsval
rendelkezni. Nem-nek s Sohasem-nek nevezze el ket, s adja meg a formlis defincijukat.
10.11.
Definilja a Rgztett prediktumot, ahol a Rgztett(Helye(x)) azt jelenti, hogy az x objektum helye az idben
rgztett.
10.12.
Definilja az Eltte, az Utna, a Kzben s az tlapoldik prediktumokat a Tallkozik prediktum s a Kezdet
s a Vg fggvnyek segtsgvel, de az Id fggvny s a < prediktum nlkl.
10.13.
329
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
A 10.5. alfejezetben a Link s a LinkSzveg prediktumokat hasznljuk weblapok kztti kapcsolat lersra.
Tbbek kzt a Cmkben s a VeddElLapot prediktumok felhasznlsval rja fel a Link s a LinkSzveg
definciit.
10.14.
A vsrlsi folyamat egyik rsze, amivel e fejezetben nem foglalkoztunk, az egyes ttelek kztti kompatibilits
ellenrzse. Ha a kliens pldul egy szmtgpet rendel, illeszkedik-e az a megfelel perifrikhoz? Ha
digitlis kamert rendel, megvan-e a hozz val memriakrtya s szrazelem? rjon fel egy olyan tudsbzist,
amely eldnti, hogy a ttelek adott halmaza kompatibilis-e. s ezt a tudsbzist fel lehessen hasznlni cserkre,
illetve tovbbi ttelek vsrlsra vonatkoz javaslatok generlsra, ha mgsem lennnek kompatibilisek.
Bizonyosodjon meg arrl, hogy a tudsbzis legalbb a termkek egy krvel jl mkdik, s knnyen
terjeszthet ki msokra is.
10.15.
Adjon szablyokat a Nv(s, c) prediktum defincijnak olyan esetekre trtn kiterjesztshez, hogy az olyan
fzrek, mint pldul a laptop szmtgp tbb bolthoz tartoz idevg kategrianvre illeszkedjen.
Ksreljen meg ltalnos rvny defincit alkotni. A defincit tesztelje tz online boltra s az ltaluk hrom
kategrira hasznlt elnevezsekre. A laptop kategria esetn pldul a Notebooks, Laptops, Notebook
szmtgpek, Notebook, Notebooks s Laptops s Notebook PC neveket talltuk. Az egyes
elnevezseket explicit Nv tnyekkel, msok a tbbes szmot, a konjunkcit stb. kezel szablyokkal
lefedhetk.
10.16.
A vsrl vsrlslersra vonatkoz pontatlan illeszkeds teljes megoldsa nagyon nehz, s szksgess teszi
a termszetes nyelvfeldolgozsi s informci-kinyersi technikk egsz sort (lsd 22. s 23. fejezet). Egy kis
lps megengedni a felhasznlnak, hogy a klnbz attribtumok minimlis s maximlis rtkeit
hatrozhassa meg. Megkveteljk, hogy a vsrl a termkek lershoz az albbi nyelvtant vegye ignybe:
Lers Kategria [Kapcsolat Mdost]*
Kapcsolat vals,
Mdost AttribtumAttrribtum Op rtk
Op =><
Itt a Kategria a termk kategrija, az Attribtum a termk valamilyen tulajdonsga, mint pldul CPU vagy
r, s az rtk egy konkrt termk attribtumnak az rtke. A szmtgp, min 2,5 GHz CPU, 250 000 Ft
alatt lekrdezst teht gy kell kifejezni, hogy szmtgp, CPU > 2,5 GHz s r < 250 000 Ft.
Implementlja az ilyen nyelven megfogalmazott termklersokat elfogad bevsrl genst.
10.17.
Az internetes bevsrlsrl szl lersunk nlklzte az alapvet fontossg lpst a termk tnyleges
megvsrlst. Adja meg a vsrls formlis logikai lerst esemnykalkulusra tmaszkodva. Azaz definilja
az esemnyek olyan sorozatt, amelyek megtrtnnek, ha a vsrl hitelkrtyval fizet, s vgl sor kerl a
szmlzsra s az ru leszlltsra.
10.18.
rja le a valamit valamirt kereskeds esemnyt. A vsrlst egyfajta kereskedsknt rja le, ahol a
kereskedsben az egyik rszt vev termk a pnz.
10.19.
Olvasnival. A kt megelz feladatban a tulajdonviszony igen egyszer fogalmt hasznltuk. A vsrl
pldul gy indul, hogy a forint bankjegyek mr a tulajdonban vannak. A modell kezd sztesni, ha pldul a
pnze bankban van, hiszen ilyenkor semmilyen konkrt bankjegymennyisg nincs, amirl ki lehetne jelenteni,
hogy a tulajdonban van. A helyzetet a klcsn, a brls, a haszonbrls s a lettbe helyezs mg tovbb
330
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
bonyoltja. Vizsglja meg a tulajdonviszony jzan sz s jogi koncepciit, s javasoljon egy olyan smt,
amelyben ezek formlisan kifejezhetk.
10.20.
A feladata egy tancsad rendszer kifejlesztse, amely az informatika szak hallgatinak ajnlan, hogy milyen
trgyakat vlasszanak a kpzs feltteleinek teljestshez (az intzmnyre jellemz felttelekkel dolgozzon).
Elszr dntse el, hogy az sszes informci reprezentlshoz milyen szkszletet fog hasznlni, majd vgezze
el a reprezentci ptst. Megfelel krdsekkel rje el, hogy a rendszer egy leglis kpzsi programot adjon
vissza. A rendszernek az egyes hallgatk ignyeihez kell illeszkednie, pldul a fakultatv trgyak javaslatnl.
Javasoljon mdszereket a rendszer tkletestsre, felhasznlva pldul a hallgati preferencikra, a terhelsre,
a j/rossz eladkra vonatkoz informcikat. Minden egyes tudsfajta esetn magyarzza meg, hogy hogyan
lehetne azt logikailag kifejezni. Knnyen be tudn-e a rendszere fogadni ezt az informcit gy, hogy egy
hallgat rszre a legjobb kpzsi programot ajnlja fel?
10.21.
A 10.1. bra a dolgok hierarchijnak fels szintjeit mutatja. Terjessze ki az brt gy, hogy a lehet legtbb
valdi kategrit tartalmazzon. Erre j mdszer, ha a mindennapi letvel kapcsolatos minden dolgot ler. Ez
objektumokat s esemnyeket fog magban foglalni. Kezdje a reggeli felkelssel, rendszeresen haladjon tovbb,
megfigyelve, hogy mit rint, mit csinl, mire gondol. Egy vletlen mintavtel eredmnye lehetne pldul a
kvetkez: zene, hrek, tej, sta, kocsivezets, benzin, Skla, sznyeg, beszlgets, Kovcs tanr r,
csirkeprklt, nyelv, 150 Ft, napi jsgok stb.
El kellene kszteni egy egysges hierarchiaft (egy nagy paprlapon) s egy listt az objektumokrl s a
kategrikrl, az egyes kategriaegyedek ltal kielgtett egy vagy tbb relcival egytt. Mindegyik
objektumnak egy kategrihoz kell tartoznia, s minden kategrinak a hierarchia rsznek kell lennie.
10.22.
(Doug Lenat egy pldjnak adaptcija.) A feladat az, hogy elegend, logikai formban kifejezett kapcsold
tudst gyjtsn ssze, hogy az albbi egyszer mondatra vonatkoz krdssort meg tudja vlaszolni:
Tegnap Jnos a Sklba ment, s vett kt kil paradicsomot s fl kil darlt hst.
Kezdje azzal, hogy a mondat tartalmt egy sor kijelentssel reprezentlja. ttekinthet logikai struktrj
lltsokat kell rnia (pldul lltsok arrl, hogy az objektumoknak bizonyos tulajdonsgai vannak, hogy az
objektumok bizonyos relciban vannak egymssal, s hogy egy adott tulajdonsgot teljest minden objektum
egy msik tulajdonsggal is rendelkezik). Az albbiak felteheten segtsgre lesznek:
Milyen osztlyokra, egyedekre, relcikra stb. lesz szksge? Mik ezeknek a szuper- s alosztlyai? (Tbbek
kzt esemnyekre s idrendi rendezsre is szksge lesz.)
Milyen mdon lehetnnek ezek a rszei egy ltalnosabb hierarchinak?
Milyenek a kzttk lv knyszerek s relcik?
Mennyire rszletesen kell lerni az egyes fogalmakat?
A megkonstruland tudsbzisnak kpesnek kell lennie a tovbbiakban kzlt krdslistt megvlaszolni. A
krdsek kzl nhny kzvetlenl magval a trtnettel foglalkozik, de a tbbsgk a httrtudst a sorok
kztti olvasst ignyli. Foglalkozni kell azzal, hogy milyen dolgokat lehet egy bevsrlkzpontban
vsrolni, hogy a kivlasztott ttelek vsrlsnl mi trtnik, hogy mi a vsrolt ttelek rendeltetse stb.
Ksrelje meg a reprezentcijt a lehet a legltalnosabbra kialaktani. Egy trivilis pldval szemllve, ne azt
lltsa, hogy Az emberek a Sklban ennivalt vsrolnak, mert ez nem segt azok kezelsben, akik mshol
szoktak vsrolni. Ne azt lltsa, hogy Jnos darlt hssal s paradicsommal spagettit ksztett, mert ez
semmilyen ms dolog kezelsben nem segt. Ne rejtsen vlaszokat a krdsekbe, a (c) krds pldul azt
krdezi, hogy Vsrolt Jnos hst?, s nem azt, hogy Vsrolt-e Jnos fl kil darlt hst?.
Adja meg a krdseket megvlaszol kvetkeztets smjt. Ennek sorn minden bizonnyal j fogalmakat is
kell krelnia s j lltsokat kell megfogalmaznia stb. Ha lehetsges, hasznljon egy logikai kvetkeztet
331
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
rendszert, hogy kimutassa a tudsbzis elgsgessgt. Sok dolog, amit ler, a valsgban csak kzeltleg lesz
igaz. Ne trdjn ezzel tl sokat, a cl azt a jzan sz tudst kinyerni, ami a krdsek megvlaszolst
egyltaln lehetsgess teszi. E krdskr igazn teljes megvlaszolsa rendkvl nehz, valsznleg meg is
haladja a mai tudsreprezentcik lehetsgeit.
a. Jnos gyerek vagy felntt? [Felntt]
b. Van Jnosnak most legalbb 2 db paradicsoma? [Igen]
c. Vsrolt Jnos hst? [Igen]
d. Ltta-e Jnos Marit, ha Mari ugyanabban az idben vsrolt paradicsomot? [Igen]
e. A paradicsomot a bevsrlkzpontban ksztik-e? [Nem]
f. Mit fog csinlni Jnos a paradicsommal? [Megeszi]
g. Kaphat-e a Sklban dezodor? [Igen]
h. Hozott-e Jnos magval elg pnzt a bevsrlkzpontba? [Igen]
i. A vsrlst kveten kevesebb pnze van-e Jnosnak? [Igen]
10.23.
Az elbbi plda tudsbzishoz ksztsen szksges bvtseket/mdostsokat gy, hogy megvlaszolhatk
legyenek az albbi krdsek. Mutassa ki, hogy a tudsbzis tnyleg kpes ezeket megvlaszolni, s a
jelentsben szmoljon be a javtsokrl, mirt volt a javtsokra szksg, s arrl is, hogy a javtsok
lnyegtelenek, illetve lnyegesek voltak.
a. Vannak-e a Sklban ms emberek, amikor Jnos ott vsrol? [Igen a szemlyzet!]
b. Vegetrinus-e Jnos? [Nem]
c. A Sklban ki a dezodor tulajdonosa? [Skla Rt.]
d. Kapott-e Jnos 1 kg darlt hst? [Igen]
e. A szomszdos MOL benzinktnl van-e benzin? [Igen]
f. Belefr-e a paradicsom Jnos kocsijba? [Igen]
10.24.
Emlkezzen arra, hogy a szemantikus hl rkldsi informcijt logikailag alkalmas implikcis lltsokkal
ki lehet fejezni. Ebben a feladatban megfontoljuk az ilyen lltsokra pl rkldsi kvetkeztets
hatkonysgt.
a. Vegyk egy hasznltaut-katalgus informcitartalmt hogy az 1999-es Mitsubishi Carisma rtke 3
milli Ft. Tegyk fel, hogy az sszes informci (a tbb tzezer modell rszre) a fejezetben ajnlott logikai
szablyok formjban van megfogalmazva. rjon fel hrom ilyen szablyt, az egyik az 1999-es Carismrl
szljon. Hogyan hasznln a szablyokat, hogy egy konkrt gpkocsi rtkt megtallhassa (pldul XY, ami
egy 1999-es Carisma), ha adott egy htrafel lncolt ttelbizonyt, mint amilyen pldul a Prolog?
b. Hasonltsa ssze az ennek a problmnak a megoldsra alkalmazott htrafel lncolt kvetkeztetsi mdszer
s a szemantikus hlban hasznlt rkldsi sma hatkonysgt.
c. Magyarzza meg, hogy az elrefel lncolt kvetkeztets hogyan teszi lehetv egy logikai rendszer szmra
ugyanannak a problmnak egy hatkony megoldst, feltve, hogy a tudsbzis csak 10 000 szablyt
tartalmaz az rakrl.
d. rjon le egy olyan helyzetet, ahol sem az elrefel, sem a htrafel lncolt kvetkeztets nem teszi lehetv a
konkrt gpkocsira vonatkoz rlekrdezs hatkony megvalstst.
332
Created by XMLmind XSL-FO Converter.
Tudsbzis reprezentci
e. Tud olyan megoldst ajnlani, ami lehetv teszi, hogy ezt a fajta lekrdezst a logikai rendszerek
mindegyikben hatkonyan tudjuk kezelni? (Segtsg: emlkezzen arra, hogy az ugyanahhoz a kategrihoz
tartoz kt gpkocsinak ugyanaz az ra.)
10.25.
Felttelezhet, hogy egy szemantikus hlban a sima s az egy vonallal bekeretezett kapcsolat kztti
szintaktikai klnbsgttel felesleges, mert az utbbi kapcsolatok csak a kategrikhoz tartoznak. Az rkldsi
algoritmusnak elg lenne feltteleznie, hogy a kategrihoz csatolt sima kapcsolat szndkoltan a kategria
minden tagjra vonatkozik. Mutassa meg a lehetsges hibk megadsval, hogy az rv hamis.
333
Created by XMLmind XSL-FO Converter.
1. A tervksztsi problma
Fontoljuk meg, hogy mi trtnne, ha egy kznsges, a standard keressi algoritmusokat mlysgi keress, A*
stb. hasznl problmamegold gens vals nagymret problmkkal kerlne szembe. Ez segthet abban,
hogy jobb tervkszt genseket tervezznk.
A legkzenfekvbb nehzsg, hogy a problmamegold genst lebnthatnk a szksgtelen cselekvsek.
Vegyk pldul a Mestersges intelligencia modern megkzeltsben c. knyv internetes megvsrlsnak a
feladatt. Tegyk fel, hogy minden egyes 10 jegy ISBN szm megvsrlsa egy-egy cselekvs, ez sszesen 10
millird cselekvst jelent. A keressi algoritmusnak mind a 10 millird cselekvs vgllapott meg kellene
vizsglnia, hogy megtallja a clnak megfelelt, nevezetesen, hogy birtokoljuk a 9635454112 ISBN szm
knyvet. Msrszrl egy rtelmes tervkszt gensnek kpesnek kell lenni arra, hogy a pontos cl
Birtokol(ISBN9635454112) lersbl visszafel dolgozva kzvetlenl eljusson a Vsrol(ISBN9635454112)
cselekvshez. Hogy ezt megtehesse, az gensnek arra az ltalnos tudsra van szksge, hogy a Vsrol(x)
kvetkezmnye a Birtokol(x). Ha adott ez a tuds, a tervez egy egyszerstsi lpsben el tudja dnteni, hogy a
Vsrol(ISBN9635454112) a helyes cselekvs.
A kvetkez nehzsg, egy j heurisztika (heuristic function) meghatrozsa. Tegyk fel, hogy az gens
feladata ngy klnbz knyv megvsrlsa. Ebbl 10 40 ngylpses terv addik, azaz nem krdses, hogy egy
megfelel heurisztika nlkli keress rtelmetlen. Az ember szmra egy llapot kltsgnek becslsre
kzenfekv heurisztika a tovbbiakban mg megvsroland knyvek szma. Sajnos ez nem nyilvnval egy
problmamegold gens szmra, hisz az a cltesztet egy fekete dobozknt ltja, mely minden llapotra
mindssze egy igaz-hamis rtket ad vissza. Ennek kvetkezmnyekpp a problmamegold gens nem
autonm; azaz emberi beavatkozst ignyel minden j problmnl az alkalmazhat heurisztika megadsra.
Msrszrl, ha az gensnek rendelkezsre ll a cl lersa, mint rszclok konjunkcija, akkor hasznlhat egy
egyszer feladatfggetlen heurisztikt: a mg nem teljestett rszclok szmt. A knyvvsrlsi feladat esetn a
cl Birtokol(A) Birtokol(B) Birtokol(C) Birtokol(D) lenne, s a Birtokol(A) Birtokol(C) llapot
kltsge 2. gy az gens szmra automatikusan elrhet a helyes heurisztika erre s ms problmkra is. A
fejezet ksbbi rszben ltni fogjuk, hogy hogyan lehet ltrehozni olyan kifinomultabb heurisztikkat, ami a
clstruktrjn tl szmba veszi a vgrehajthat cselekvseket is.
334
Created by XMLmind XSL-FO Converter.
Tervkszts
Vgl a problmamegold gens nem hatkony, mert nem tudja kihasznlni a problmadekompozci
(problem decomposition) lehetsgt. Vegyk pldul a kvetkez feladatot: tbb csomagot kell kiszlltanunk
a megfelel cmekre, melyek Ausztrlia klnbz pontjain tallhatk. J megkzelts, ha megkeressk a
clpontokhoz legkzelebb es reptereket, s felosztjuk a teljes problmt tbb rszfeladatra; repterenknt egyre.
Az egy reptren keresztl irnytott csomagok esetn a tovbbi dekompozci lehetsge a clvrostl fgg. Az
5. fejezetben lttuk, hogy egy ilyen felbonts kpessge hozzjrul a knyszerkielgtsi feladatmegoldk
hatkonysghoz. A tervksztkre ugyanez igaz: a legrosszabb esetben n csomag legjobb kiszlltsi tervnek
elksztse O(n!), mg ha a feladat k egyenl rszre bonthat ez mindssze O((n/k)! k) komplexits feladat.
Ahogy az 5. fejezetben megjegyeztk, a teljesen dekomponlhat problmk jk, de ritkk. 1 A legtbb
tervkszt rendszer felptse klnsen a 11.3. fejezetben bemutatsra kerl rszben rendezett tervkszt
felptse azon a felttelezsen alapul, mely szerint a legtbb vals, letszer problma majdnem
dekomponlhat (nearly decomposable). Ez annyit jelent, hogy a tervkszt dolgozhat fggetlen
rszclokon, de a rsztervek sszekombinlsa tovbbi feladatokat eredmnyezhet. Nhny feladat esetn ez a
felttelezs nem helytll, mert az egyik rszcl kidolgozsa gyakran megbontja a msik rszclt. Ezek a
rszclok kztti klcsnhatsok azok, amelyek a fejtrket (mint a nyolcas kirak) valjban fejtrv teszik.
Ezt pontosabban cselekvsi smnak (action schema) nevezzk, ami azt takarja, hogy ez szmos klnbz
cselekvst reprezentl, ami a p, honnan s a hova vltozk klnbz behelyettestseivel szrmaztathat.
ltalnossgban a cselekvsi sma hrom f rszbl ll:
A cselekvs megnevezse s paramterlistja pldul a Repl(p, honnan, hova) a cselekvs azonostsra
szolgl.
Vegyk szre, hogy mg a csomagkiszlltsi feladat sem teljesen dekomponlhat. Vannak esetek, amikor jobb a csomagokat mgis egy
tvolabbi reptrre irnytani, ha ezzel megsprolhatunk egy kln repljratot a kzelire. Mindemellett a legtbb szlltcg inkbb a mr
bejratott dekomponlt megoldsokhoz ragaszkodik, hogy cskkentse a szmtsi s szervezsi nehzsgeket.
2
A STRIPS a STandford Research Institute Problem Solver rvidtse.
1
335
Created by XMLmind XSL-FO Converter.
Tervkszts
Az elfelttel (precondition), fggvnyektl mentes pozitv literlok konjunkcija, azt mutatva, hogy milyen
feltteleknek kell elzetesen teljeslni a cselekvs vgrehajtshoz.
A kvetkezmny (effect), fggvnyektl mentes literlok konjunkcija, ami lerja, hogy az llapot hogyan
vltozik, amikor a cselekvs vgrehajtsra kerl. A cselekmny eredmnyekpp add kvetkezmnyrszben
szerepl P pozitv literl igaz rtket kap, mg a P hamis rtket vesz fel. A kvetkezmnyrszben szerepl
vltozknak a cselekvs elfelttelei kztt is szerepelni kell.
Az olvashatsg javtsa rdekben nhny tervkszt kvetkezmnyrszt sztvlasztja egy hozzads listra
(add list) a pozitv s egy trls listra (delete list) a negatv literloknak.
Most hogy a tervksztk reprezentcijnak szintaxist definiltuk, adjuk meg a szemantikt is. Ennek
legegyszerbb mdja, ha lerjuk, hogy a cselekvsek hogyan mdostjk az llapotot. (Egy msik lehetsges
mdszer, hogy egy direkt fordtst specifiklunk a kvetkez llapot aximkra, melyek szemantikja az
elsrend logikbl szrmazik. Lsd 11.3. feladat.) Elszr is azt mondjuk, hogy egy cselekvs alkalmazhat
(applicable) minden llapotban, ami kielgti az elfeltteleket; egybknt a cselekvs hatstalan. Egy
elsrend sma esetben az alkalmazhatsg elrse az elfelttelek egy behelyettestst vonja maga utn.
Tegyk fel pldul, hogy a jelen llapot lersa:
Ott(P1, JFK) Ott(P2, SFO) Repl(P1) Repl(P2)
Repltr(JFK) Repltr(SFO)
Ez teljesti az
Ott(p, honnan) Repl(p) Repltr(honnan) Repltr(hova)
Vegyk szre, hogy a mr szerepl pozitv kvetkezmnyeket nem szrjuk be mg egyszer, illetve ha egy
negatv literl nem szerepel az llapotlersban, akkor a kvetkezmny ezen rsze figyelmen kvl hagyhat. Ez
a definci testesti meg az gynevezett STRIPS felttelezst (assumption): minden a kvetkezmnyben nem
szerepl literl vltozatlan marad. gy a STRIPS elkerli a 10. fejezetben bemutatott reprezentcis keret
problmt (representional frame problem).
Vgezetl definilhatjuk a tervksztsi problma megoldst (solution). Legegyszerbb formjban ez csak
egy cselekvssorozat, melyet a kiindulsi llapotbl vgrehajtva a clllapotot eredmnyezi. A fejezet tovbbi
rszeiben a megoldsok cselekvsek rszben rendezett sorozatai is lehetnek, amennyiben minden
cselekvssorozat, ami megfelel ennek a rszben rendezsnek, megolds.
336
Created by XMLmind XSL-FO Converter.
Tervkszts
Napjainkra, nyilvnvalv vlt, hogy a STRIPS nem elgg kifejez nhny vals problmakrhz. Ennek
eredmnyekppen szmos nyelvvltozatot dolgoztak ki. A 11.1. bra rviden sszefoglalja az egyik
legfontosabbat, a cselekvsler nyelvet (Action Description Language ADL) gy, hogy sszehasonltja azt
a STRIPS alapverzijval. ADL nyelven a Repls lersa az albbi:
Cselekvs(Repl(p : Repl, honnan : Repltr, hova : Repltr),
Elfelttel: Ott(p, honnan) (honnan hova)
Kvetkezmny: Ott(p, honnan) Ott(p, hova))
A p : Repl rsmd az elfelttelek a paramterlistjban a Repl(p) egy rvidtse, ami nem nveli a
kifejezkpessget, de javtja az olvashatsgot. (Mindemellett reduklja a ltrehozhat tletlogikai
cselekvsek szmt.) A (honnan hova) elfelttel azt a tnyt fejezi ki, hogy egy replt kiindulsi s
clllomsa nem lehet azonos. Ezt a STRIPS nyelvben nem lehetne tmren kifejezni.
A mestersges intelligenciban hasznlt vltozatos tervkszt formalizmusokat egy szabvnyos szintaxisba
rendszerezik, amit tervksztsi terlet defincis nyelvnek (Planning Domain Definition Language
PDDL) neveznek. Ez a nyelv lehetv teszi a kutatk szmra, hogy benchmark problmkat cserljenek ki
egyms kztt, s sszevessk az eredmnyeket. A PDDL rsznyelveket tartalmaz az ADL s a 12. fejezetben
bemutatsra kerl hierarchikus feladathlzatok szmra.
A STRIPS s az ADL jellsrendszere szmos vals problmakrre megfelel. A kvetkez alfejezetek nhny
egyszer pldt mutatnak be. Nhny szmottev megkts azrt mg megmaradt. A legnyilvnvalbb, hogy
kzvetlenl nem tartalmazzk a cselekvsek vghatsait (ramifications). Pldul ha vannak emberek,
csomagok vagy porcick egy repln, akkor mindannyian helyet vltoztatnak egy repls sorn. Ezeket a
vltozsokat lerhatjuk, mint a repls egyenes kvetkezmnyeit, gy termszetesebbnek tnik a replgp
tartalmnak helyt, mint a gp helynek logikai kvetkezmnyt brzolni. Az ilyen llapotmegktsekre
(state constraints) a 11.5. alfejezet tartalmaz pldkat. A hagyomnyos tervkszt rendszerek meg sem
prbljk megoldani a kvalifikcis problmt (qualification problem), azaz a nem reprezentlt krlmnyek
problmjt, melyek a cselekvs meghisulst okozhatjk. A 12. fejezetben ltni fogjuk, hogy a kvalifikcis
problma hogyan kzelthet meg.
337
Created by XMLmind XSL-FO Converter.
Tervkszts
A mi reprezentcink tisztn STRIPS nyelv. Nevezetesen ez engedlyezi, hogy egy repl kiindul s
clllomsa azonos repltr legyen. Az ADL egyenltlensg opertorai ezt kizrhatnk.
338
Created by XMLmind XSL-FO Converter.
Tervkszts
Msodszor az res(b) prediktumot gy rtelmezhetjk, hogy b tetejn van elg szabad hely, ahov a kockt
letehetjk. Ezek szerint az res(Asztal) mindig igaz. Az egyetlen problma, hogy semmi nem gtolja a
tervksztt abban, hogy a Mozgat(b, x, Asztal) cselekvst alkalmazza az AsztalraTesz(b, x) helyett. Vagy egytt
A tervkszts kutatsban hasznlt kockavilg sokkal egyszerbb, mint az SHRDLU verzi, amit az 3.3. szakasz - Korai lelkeseds, nagy
elvrsok (19521969) rszben mutattunk be.
3
339
Created by XMLmind XSL-FO Converter.
Tervkszts
lnk ezzel a problmval (amely egybknt a szksgesnl nagyobb keressi teret eredmnyez, de nem vezet
hibs vlaszokhoz), vagy bevezethetjk a Kocka prediktumot, s a Mozgat cselekvs elfeltteleihez
hozztehetjk a Kocka(x) Kocka(b) rszt.
Vgl itt van mg az olyan hibs mveletek esete, mint a Mozgat(B, C, C), amely hatstalan kellene legyen,
ehelyett azonban ellentmond kvetkezmnyekhez vezet. ltalban nem foglalkozunk az ilyen jelleg
problmkkal, mert nemigen vannak hatssal az ellltott tervekre. A helyes megkzelts, hogy
egyenltlensgi elfeltteleket vezetnk be, amint azt a 11.4. bra mutatja.
2. Tervkszts llapottr-keresssel
Most fordtsuk figyelmnket a tervkszt algoritmusok fel. A legkzenfekvbb megkzelts az llapottrkeress. Mivel a tervksztsi problmk cselekvseinek lersa tartalmazza az elfeltteleket s a
kvetkezmnyeket, a keress mindkt irnyban vgrehajthat: vagy elrefel egy kiindulsi llapotbl, vagy
visszafel a cltl, amint azt a 11.5. bra is mutatja. Mindezeken tl felhasznlhatjuk az explicit cselekvs- s
clreprezentcikat, hogy automatikusan hatkony heurisztikkat szrmaztassunk.
340
Created by XMLmind XSL-FO Converter.
Tervkszts
11.5. bra - A tervkszts kt megkzeltse. (a) Elrefel (progresszv) llapottrkeress, a kiindul llapotbl indulva s a problma cselekvseit hasznlva halad a cl
fel. (b) Visszafel (regresszis) llapottr-keress: valsznsgi llapot keress (lsd
6.1. szakasz - Szenzor nlkli problmk rszben) a clllapot(ok)bl indulva a
cselekvsek inverzt alkalmazva keresi visszafel a kezdeti llapotot.
Emlkezznk vissza, hogy a fggvnyszimblumok hinyban a tervksztsi problma llapottere vges, ezrt
teljes grf keressi algoritmusok, mint pldul az A* keress, egyben teljes tervkszt algoritmusok is.
A tervksztk kutatsnak korai napjaitl (kb. 1961-tl) egszen mostanig (kb. 1998-ig) az a felttelezs lt,
hogy az elrefel keres algoritmusok nem elgg hatkonyak a gyakorlati alkalmazsra. Ma mr, tekintsnk
csak vissza a 11.1. alfejezetre, ezt nem nehz megindokolni. Elszr is az elrefel keress nem foglalkozik a
lnyegtelen cselekvsek problmjval, mivel minden llapotban minden alkalmazhat cselekvst figyelembe
vesz. Msodszor pedig ez a megkzelts gyorsan elakad egy j heurisztika nlkl. Vegyk pldul a lgi
csomagszlltsi problmt 10 repltrrel, egyenknt 5-5 replvel s 20 darab csomaggal. A cl, hogy az A
repltr sszes terht a B repltrre szlltsuk. Van egy egyszer megoldsa a feladatnak: tegyk be mind a
20 csomagot az egyik A-beli replgpbe, ezzel repljnk B-be, s ott rakodjunk ki. A megolds megkeresse
ellenben nagyon nehz lehet, hiszen az tlagos elgazsi faktor risi: mind az 50 repl 9 msik reptrre tud
replni, mg mind a 200 csomag kirakhat (ha be volt rakva), vagy berakhat a reptr brmelyik repljbe.
tlagosan mondjuk 1000 lehetsges cselekvs hajthat vgre, gy a keressi fban a kzenfekv megolds
mlysgig kzel 100041 csompont van. Ebbl nyilvnval, hogy egy megfelel heurisztikra lesz szksg,
hogy ezt a keresst hatkonny tegyk. A htrafel keress ttekintse utn nhny lehetsges heurisztikt
mutatunk be.
341
Created by XMLmind XSL-FO Converter.
Tervkszts
Pldul a 10-replteres lgi csomagszlltsi problmnk esetben a cl az, hogy a 20 csomag a B repltren
legyen, vagy pontosabban
Ott(C1, B) Ott(C2, B) Ott(C20, B)
s a relevns cselekvs a Kirakods(C1, p, B), ami az els literlt adja. A cselekvs csak akkor mkdik, ha az
elfelttelei teljeslnek. Ebbl kifolylag az eldllapotnak tartalmaznia kell a Benne(C1, p) Ott(p, B)
elfeltteleket. Mindezeken tl az Ott(C1, B) rszcl nem lehet igaz a megelz llapotban.4 gy a megelz
llapot lersa az albbi:
Benne(C1, p) Ott(p, B) Ott(C2, B) Ott(C20, B)
Ennek tetejbe, ha elvrjuk, hogy egy cselekvs kielgtsen egy literlt, azt is biztostanunk kell, hogy nem ront
el egy msikat. Az olyan cselekvst, ami megfelel ennek az elvrsnak konzisztensnek (consistent) nevezzk.
Pldul a Berakods(C2, p) cselekvs nem lenne konzisztens az aktulis cllal, mert neglja az Ott(C2, B) literlt.
Most, hogy a relevancit s a konzisztencit definiltuk, megadhatunk egy ltalnos mdszert a htrafel
keress eldllapotnak keresshez. Adott egy G cl lersa. Legyen az A cselekvs relevns s konzisztens. A
megfelel eldllapot a kvetkez:
Az A minden pozitv kvetkezmnyt, ami szerepel G-ben, trljk.
Az A minden, mg nem szerepl elfelttelt hozzadjuk.
A standard keressi algoritmusok brmelyike felhasznlhat a keressre. A lellsi felttel, hogy a generlt
eldllapot lerst a keress kiindulsi llapota kielgtse. Az elsrend esetben, ehhez nhny vltoz
behelyettestsre is szksg lehet az eldllapotnak lersban. Pldul az elz bekezds eldllapotnak
lerst a
Benne(C1, P12) Ott(P12, B) Ott(C2, B) Ott(C20, B)
kiindulsi llapot a {p/P12} behelyettestssel teljesti. A behelyettestseket arra a cselekvsre kell vgrehajtani,
ami az llapottl a clhoz vezet, gy eredmnyezve a [Kirakods(C1, P12, B)] megoldst.
342
Created by XMLmind XSL-FO Converter.
Tervkszts
pontos szm meghatrozsa NP-teljes problma, de a legtbb esetben tallhatk kellen pontos becslk, melyek
nem nagyon szmtsignyesek. Szintn kpesek lehetnk egy elfogadhat (admissable) heurisztika
szrmaztatsra, azaz olyanra, ami nem becsl tl. Ez az A* keresssel egytt hasznlhat optimlis
megoldsok megkeressre.
Kt megkzeltst lehet kiprblni. Az egyik, hogy a megadott feladatlersbl egy relaxlt problmt (relaxed
problem) szrmaztatunk, ahogy azt a 4. fejezetben bemutattuk. A relaxlt problmra (ami vrhatan knnyen
megoldhat) adott optimlis megolds kltsge elfogadhat heurisztikt ad az eredeti problmra. A msodik
megkzelts sorn felttelezzk, hogy a tiszta oszd meg s uralkodj algoritmus mkdni fog. Ezt nevezzk a
rszclfggetlensg (subgoal independence) felttelezsnek: a rszclok konjunkcijnak megoldsi kltsgt,
az egymstl fggetlenl megoldott rszclok kltsgeinek sszegvel becsljk. A rszclfggetlensg
felttelezs lehet optimista vagy pesszimista. Akkor optimista, hogyha vannak negatv klcsnhatsok a
rszclokhoz ksztett rsztervek kztt (pldul amikor az egyik rszterv egy cselekvse trl egy clt, melyet
egy msik rszterv rt el). Akkor pesszimista s egyben elfogadhatatlan is, ha a rsztervek redundns
cselekvseket tartalmaznak (pldul kt cselekvs eggyel helyettesthet az sszefslt tervben).
Vizsgljuk meg, hogyan szrmaztathatunk relaxlt tervksztsi problmkat. Mivel az elfelttelek s a
kvetkezmnyek explicit megadsai rendelkezsre llnak, az eljrs ezeket a reprezentcikat mdostja.
(Vessk ssze ezt a megkzeltst a keressi feladatokkal, ahol az llapottmenet-fggvny egy fekete doboz.)
A legegyszerbb tlet, hogy laztsuk a problmt gy, hogy eltvoltjuk az sszes elfelttelt a cselekvsekbl.
Ekkor minden cselekvs mindig alkalmazhatv vlik, s minden literl elrhet egy lpsben (ha van
alkalmazhat cselekvs, egybknt a cl elrse lehetetlen). gy tnhet, ez azt jelenti, hogy a clok
konjunkcijhoz vezet lpsszm azonos a kielgtetlen clliterlok szmval, de nem egszen; (1) lehet kt
cselekvs, melyek klcsnsen trlik a msik ltal teljestett clliterlt, (2) nhny cselekvs tbb clt is elrhet.
Ha kombinljuk a relaxlt problmt s a rszcl fggetlensgi felttelezst, mindkt problmt kikszbltnek
vehetjk, s az elll heurisztika pontosan a mg kielgtetlen clok szma.
Sokszor pontosabb heurisztika nyerhet, ha legalbb a tbb clt kielgt cselekvsek pozitv klcsnhatsait
figyelembe vesszk. Elszr tovbb relaxljuk a problmt azltal, hogy eltvoltjuk a negatv kvetkezmnyeket
(lsd 11.6. feladat). Ezutn kiszmtjuk, hogy mennyi az a minimlis cselekvsszm, melyek pozitv
kvetkezmnyeinek unija kielgti a clt. Vegyk pldul a
Cl(A B C)
Cselekvs(X, Kvetkezmny: A P)
Cselekvs(Y, Kvetkezmny: B C Q)
Cselekvs(Z, Kvetkezmny: B P Q)
A minimlis halmaz az {X, Y} cselekvs, ami az {A, B, C} clt kielgti, gy a fedhalmaz-heurisztika szerinti
kltsg 2. Ez javt a rszcl fggetlensg felttelezsen, ami 3-as kltsget adna. Egyetlen apr problma van: a
fedhalmaz problma NP-teljes. Az egyszer fedhalmaz-keressi algoritmus garantltan visszaad egy rtket,
ami egy log n-es faktor pontossggal az igazi minimumrtk, ahol n a cl literljainak szma, s a gyakorlatban
rendszerint ennl sokkal pontosabb. Sajnos a moh algoritmus elveszti a heurisztika elfogadhatsgnak
garancijt.
Az is lehetsges, hogy a relaxlt problmt a negatv kvetkezmnyek eltvoltsval lltjuk el anlkl, hogy
az elfeltteleket elhagynnk. Ez annyit tesz, hogy ha egy cselekvs kvetkezmnye A B az eredeti
problmban, akkor A a relaxlt problmban. Ez annyit tesz, hogy nem kell foglalkoznunk a rsztervek kztti
negatv klcsnhatsokkal, mert egyetlen cselekvs sem trlhet egy msik ltal ellltott literlt. Az gy
elll relaxlt feladat megoldsnak kltsge az res-trlsi-lista (empty-delete-list) heurisztikt adja. A
heurisztika meglehetsen pontos, de kiszmtsa egy (egyszer) tervkszt algoritmus futtatst ignyli. A
gyakorlatban a relaxlt problma megoldsa elg gyors ahhoz, hogy megrje alkalmazni.
Az itt bemutatott heurisztika mind a progresszv (elrefel), mind pedig a regresszv (htrafel) irnyba
hasznlhat. A knyv rsnak pillanatban az res-trlsi-lista heurisztikt hasznl elrefel keresk a
listavezetk. Ez valsznleg vltozik, ahogy jabb heurisztikk s keressi technikk jelennek meg. Mivel a
tervkszts exponencilis komplexits,5 nincs olyan algoritmus, amely minden problmra hatkony lesz, de
Technikailag a STRIPS-alap tervkszts PSPACE-teljes, kivve, ha a cselekvseknek csak pozitv elfelttelei vannak egy
kvetkezmny literllal (Bylander, 1994).
5
343
Created by XMLmind XSL-FO Converter.
Tervkszts
szmos gyakorlati feladat oldhat meg ezen fejezet heurisztikival sokkal tbb, mint ami nhny ve
megoldhat volt.
11.6. bra - Egy rszben rendezett terv a zokni s a cip felvtelhez, s a hat lehetsges
sorba rendezs a teljesen rendezett tervhez
344
Created by XMLmind XSL-FO Converter.
Tervkszts
A rszben rendezett tervkszts megvalsthat, mint egy keress a rszben rendezett tervek terben. (Ezentl
ezeket egyszeren csak terv-nek nevezzk.) Egy res tervvel indulunk. Ezutn a terv finomtsnak mdjait
keressk egszen addig, mg el nem llunk a teljes tervvel, ami megoldsa a problmnak. A cselekvsek
ebben a keressben nem a val vilg cselekvsei, hanem terveken vgrehajtott mveletek: egy lps hozzadsa
a tervhez, a cselekvsekhez egy sorrend rendelse, ami egy cselekvst egy msik el helyez s gy tovbb.
A tovbbiakban definilni fogjuk az RRT algoritmust a rszben rendezett tervksztshez. Hagyomnyosan az
RRT-t mint egy nll programot szoks bemutatni, ehelyett mi a rszben rendezett tervksztst, mint a
keressi problma egy pldnyt fogjuk megfogalmazni. Ez lehetv teszi, hogy az alkalmazhat tervfinomt
lpsekre koncentrljunk ahelyett, hogy azt vizsglnnk, hogyan trkpezi fel a keressi teret az algoritmus.
Valjban, ha a keressi feladatot megfogalmaztuk a nem informlt vagy heurisztikus keressi mdszerek szles
vlasztka ll rendelkezsre.
Emlkezznk vissza, hogy a keressnk llapotai (tbbnyire mg befejezetlen) tervek lesznek. Hogy elkerljk
a vals cselekvsekkel val keveredst, itt tervekrl s nem llapotokrl fogunk beszlni. Minden terv a
kvetkez ngy komponensbl ll, ahol az els kett a terv lpseit definilja, mg az utols kett naplzsra
szolgl, hogy abbl meghatrozzuk, hogyan bvthetk a tervek:
Cselekvsek (actions) halmaza, amelyek a terv lpseit adjk. Ezeket a tervksztsi problma
cselekvshalmazbl vesszk. Egy res terv csak az Indt s a Befejez cselekvseket tartalmazza. Az Indtnak nincsenek elfelttelei, mg a kvetkezmnyrsze a tervksztsi feladat kiindulsi llapotnak literljait
tartalmazza. A Befejez cselekvsnek nincsen kvetkezmny rsze, mg elfelttelei megegyeznek a clllapot
literljaival.
Rendezsi knyszerek (ordering constraints). Minden rendezsi knyszer A B alak, amit B eltt Anak olvasunk, s azt jelenti, hogy az A-t valamikor a B eltt kell vgrehajtani, de nem felttlenl kzvetlen
eltte. A rendezsi knyszerek egy megfelel rszben rendezst kell lerjanak. Brmilyen ciklus (mint az A
B s a B A) ellentmondst jelent, ezrt olyan rendezsi knyszer nem adhat a tervhez, amely ciklust hozna
ltre.
Okozati kapcsolatok (causal links). Az A s B cselekvsek kztti okozati kapcsolatot
-vel
Tervkszts
Nyitott elfelttelek: {}
Fontos
Konzisztens tervnek (consistent plan) nevezzk azt a tervet, amelyben nincsenek ciklusok a rendezsi
megktsekben s nincsenek ellentmondsok az okozati kapcsolatokkal. Egy konzisztens terv, mely
nyitott elfelttelektl mentes, a megolds (solution). Rvid gondolkodssal belthat: egy rszben
rendezett megolds minden sorba rendezse egy teljesen rendezett megolds, melynek vgrehajtsa az
indul llapotbl egy clllapotra vezet. Ez annyit tesz, hogy a terv vgrehajtst a teljesen rendezett
tervekrl kiterjeszthetjk a rszben rendezett tervekre. Egy rszben rendezett terv vgrehajtsa sorn
ismtlden mindig vlasztunk egy kvetkez cselekvst, a lehetsges kvetkez cselekvsek
brmelyikt. A 12. fejezetben ltni fogjuk, hogy az gens szmra a terv vgrehajtsnak rugalmassga
nagyon hasznos lehet, ha a krnyezet nem az elvrtaknak megfelelen mkdik. A rugalmas
sorrendezs egyszersti a kisebb tervek sszekombinlst nagyobbakk, mert minden rszterv
trendezheti a cselekvseinek sorrendjt, hogy elkerlje a ms tervekkel val tkzst.
Most mr kszen llunk arra, hogy formalizljuk azt a keressi problmt, amit az RRT megold. Egy olyan
formalizlssal kezdnk, ami az tletlogikai tervksztsi problmkra alkalmas, az elsrend logikai
megoldssal jr komplikcikat ksbbre hagyjuk. Mint rendszerint, a definci tartalmazza a kiindul
llapotot, a cselekvseket s a cltesztet.
A kiindulsi terv egy Indt s egy Befejez cselekvst, egy Indt Befejez rendezst tartalmaz, s nincsenek
okozati kapcsolatok. A Befejez minden elfelttele nyitott.
Az llapottmenet-fggvny nknyesen kivlasztja B egy p nyitott elfelttelt s legenerl egy kvetkez
tervet egy A cselekvs minden olyan lehetsges konzisztens megvlasztshoz, mely teljesti p-t. A
konzisztencit a kvetkezkpp biztostjuk:
1. Az
okozati kapcsolatot s az A B rendezsi megktst hozzadjuk a tervhez. Az A cselekvs
lehet a terv egy mr ltez vagy egy j cselekvse. Amennyiben j, hozzadjuk a tervhez az Indt A s
az A Befejez megktsekkel.
2. Feloldunk minden konfliktust, az j okozati kapcsolat s az sszes ltez cselekvs, valamint az A
cselekvs (ha j) s minden ltez okozati kapcsolat kztt. Egy az
s C kztt fennll
konfliktust azltal oldunk fel, hogy C-t valamikor kvl helyezzk a vdett intervallumon a B C vagy a
C A hozzadsval. Amennyiben konzisztens tervet adnak, beszrjuk a kvet llapotokat,
valamelyikhez vagy akr mindketthz.
A clteszt ellenrzi, hogy a terv megoldsa-e az eredeti tervksztsi problmnak. Mivel csak konzisztens
terveket lltunk el, a cltesztnek csak azt kell ellenrizni, hogy vannak-e nem nyitott elfelttelek.
346
Created by XMLmind XSL-FO Converter.
Tervkszts
Emlkezznk, hogy keressi algoritmus ltal vizsglt cselekvsek ebben a felrsban sokkal inkbb tervfinomt
lpsek, mint vals cselekvsek a feladattrbl. Az t kltsge ezrt szigor rtelembe vve irrelevns, hiszen az
egyetlen ami fontos, az azon terv vals cselekvseinek kltsge, amire ez az t vezetett. Mindazonltal
lehetsges egy tvonalkltsg-fggvny specifiklsa, ami a vals terv kltsgeit tkrzi: minden vals
cselekvsnek a tervhez val hozzadst egysgnyi kltsggel, mg a finomt lpseket 0 kltsggel vesszk
figyelembe. gy g(n), ahol n a terv, egyenl lesz a tervben tallhat vals cselekvsek szmval. Egy
heurisztikus h(n) becsls szintn alkalmazhat.
Els rnzsre azt gondolhatjuk, hogy az llapottmenet-fggvnynek minden nyitott p-hez tartalmaznia kellene
egy kvetkez llapotot, nem csak egyhez. Ez azonban, redundns lenne s nem lenne hatkony, ugyanazon
okbl, amirt a knyszerkielgtsi algoritmusok nem szrnak be minden lehetsges vltozhoz utdot: a nyitott
elfelttelek kezelsi sorrendje (csakgy, mint a knyszerkielgtsi problma vltozinak kezelsi sorrendje)
kommutatv. (Lsd 2. szakasz - A visszalpses keress alkalmazsa knyszerkielgtsi problmkra rszben.)
gy tetszleges sorrendet vlaszthatunk, s az algoritmusaink mg mindig teljesek. A helyes rendezs
megvlasztsa gyorsabb keresshez vezethet, de minden sorrendezs ugyanazokra a megoldsjelltekre vezet.
A megolds keresse egy kezdeti tervbl indul, ami egy Indt cselekvst tartalmaz az Ott(Ptkerk,
Csomagtart) Ott(LaposKerk, Tengely) kvetkezmnnyel s egy Befejez cselekvst az Ott(Ptkerk,
Tengely) elfelttellel. Ezutn kvet llapotokat lltunk el gy, hogy egy nyitott elfelttelt vlasztunk a
munkhoz (visszavonhatatlanul), majd vlasztunk az ehhez vezet lehetsges cselekvsek kzl. Most nem
foglalkozunk a heurisztikkkal, amik segthetik ezt a dntst; ltszlag vletlenszer dntst hozunk. Az
esemnyek sorrendje a kvetkez:
1. Vegyk az egyetlen nyitott elfelttelt, a Befejez cselekvs Ott(Ptkerk, Tengely) felttelt. Vlasszuk ki az
egyetlen alkalmazhat cselekvst, a Felszerel(Ptkerk, Tengely)-t.
2. Vegyk a Felszerel(Ptkerk, Tengely) cselekvs Ott(Ptkerk, Fld) elfelttelt. Vlasszuk az
Eltvolt(Ptkerk, Csomagtart) cselekvst, ami az egyetlen alkalmazhat cselekvs az elfelttel
biztostshoz. A vgs terv a 11.8. brn lthat.
11.8. bra - A nem teljes rszben rendezett terv a kerkcsere problmhoz, miutn
megvlasztottuk a cselekvseket az els kt nyitott elfelttelhez. A dobozok
cselekvseket testestenek meg, a bal oldalon az elfelttelekkel, a jobb oldalon pedig a
347
Created by XMLmind XSL-FO Converter.
Tervkszts
okozati kapcsolattal. Hogy feloldjuk ezt az tkzst, egy rendezsi megktst illesztnk be, ami az
Otthagyjszakra cselekvst az Eltvolt(Ptkerk, Csomagtart) el rendeli. Az gy elll terv a 11.9. brn
lthat. (Mirt oldja ez fel az tkzst s mirt nincs erre ms lehetsg?)
4. Most az egyetlen fennmarad nyitott elfelttel az Ott(Ptkerk, Csomagtart), ami az Eltvolt(Ptkerk,
Csomagtart) cselekvs elfelttele. Az egyetlen cselekvs, ami ezt elrheti, a meglv Indt cselekvs, de az
Indt s az Eltvolt(Ptkerk, Csomagtart) kztti okozati kapcsolat tkzik az Otthagyjszakra
cselekvs Ott(Ptkerk, Csomagtart) kvetkezmnyvel. Most nincs md arra, hogy feloldjuk az tkzst
az Otthagyjszakra cselekvssel: nem sorolhatjuk az Indt el (mert semmi nem kerlhet az Indt el), s
nem rendelhet az Eltvolt(Ptkerk, Csomagtart) utn (mert mr van egy rendezs, ami el helyezi). Ezrt
muszj visszalpnnk, trlnnk az Eltvolt(Ptkerk, Csomagtart) cselekvst s a kt utols okozati
kapcsolatot, s visszalpnnk a 11.8. brn bemutatott llapothoz.
348
Created by XMLmind XSL-FO Converter.
Tervkszts
Br ez a plda nagyon egyszer, jl szemllteti a rszben rendezett tervkszts erssgt. Elszr is az okozati
kapcsolatok a keressi tr (fa) egy korai szktshez metszshez vezettek, mert kizrtak olyan terleteket,
amelyek a feloldhatatlan tkzsek miatt nem tartalmaznak megoldsokat. Msodszor a 11.10. bra megoldsa
egy rszben rendezett terv. Ebben az esetben ennek elnye nem nagy, mert csak kt lehetsges sorba rendezs
ltezik, mgis egy gens szmra elnys lehet ez a rugalmassg, pldul ha a kereket sr forgalomban kellene
lecserlni.
A plda szintn rmutat nhny javtsi lehetsgre. Pldul egy prblkozs dupln trtnt: az Indt az
Eltvolt(Ptkerk, Csomagtart) cselekvshez kapcsoldik mg mieltt az tkzs visszalpst vltana ki, s a
visszalps hatsra a kapcsolat felbomlik, br nem vesz rszt az tkzsben. A keress folytatsakor a
kapcsolat jra ltrejn. Ez tipikus az idrendi visszalps esetn s elkerlhet, ha fggsgvezrelt visszalpst
hasznlunk.
Ez az x vltozt ktetlenl hagyja. Ez annyit tesz, hogy a cselekvs annyit mond, hogy mozgasd A-t
valahonnan, de azt nem, hogy honnt. Ez egy msik plda a legkisebb megkts elvre: elhalaszthatjuk a
dntseket egszen addig, amg a terv egy msik lpse ezt meghozza neknk. Tegyk fel pldul, hogy a
Rajta(A, D) a kiindul llapotunk. Az x-et D-vel behelyettestve az Indt cselekvs hasznlhat fel, hogy elrjk
a Rajta(A, x)-et. A mdszer, hogy tbb informcit kivrunk, mieltt megvlasztjuk x-et, gyakran sokkal
hatkonyabb, mint az x minden rtknek kiprblsa s a visszalps, ha ez sikertelen.
A vltozk jelenlte az elfelttelekben s a cselekvsekben nehezti az tkzsek detektlst s feloldst.
Pldul amikor a Mozgat(A, x, B) a terv rsze lesz, a
okozati kapcsolatra is szksg van. Ha van egy M2 cselekvs Rajta(A, z) kvetkezmnnyel, akkor ez csak
akkor okoz tkzst, ha a z rtke B. Hogy kezeljk ezt a lehetsget, kiterjesztjk a tervek reprezentcijt,
349
Created by XMLmind XSL-FO Converter.
Tervkszts
hogy tartalmazzanak z X alak egyenltlensgi knyszereket (inequality constraints), ahol z egy vltoz s
X egy vltoz vagy egy konstansszimblum. Ebben az esetben az tkzst a z B hozzadsval oldhatjuk fel,
ami azt jelenti hogy a terv ksbb B kivtelvel brmire behelyettestheti z-t. Brmikor amikor egy
behelyettestst hajtunk vgre a tervben, ellenriznnk kell, hogy az nem ellenkezik-e az egyenltlensgi
korltokkal. Pldul egy x/y behelyettests tkzik az x y knyszerrel. Az ilyen ellenttek nem oldhatk fel,
ezrt a tervkszt visszalpsre knyszerl.
A 12.6. alfejezetben egy bvebb pldt adunk a rszben rendezett tervksztsre, ami a vltozkat tartalmaz
kockavilg problma.
4. Tervksztsi grfok
Az sszes javasolt heurisztika a teljesen rendezett s a rszben rendezett tervksztsre pontatlansgokkal
terhelt. Ez a fejezet bemutatja, hogy egy specilis adatszerkezet a tervksztsi grf (planning graph)
felhasznlhat, hogy jobb heurisztikus becslseket nyerjnk. Ezek a heurisztikk brmely eddig trgyalt keressi
technikval hasznlhatk. Egy msik lehetsg, hogy a megoldst kzvetlenl a tervksztsi grfbl nyerjk ki
egy erre kilezett algoritmussal, mint amilyen pldul a GRAPHPLAN.
A tervksztsi grf a terv idrendi lpseinek megfelel szintekbl ll, ahol a 0-dik szint a kiindul llapot.
Minden szint egy literlhalmazt s egy cselekvshalmazt tartalmaz. A literlok durvn azok, melyek igazak
lehetnek az adott lpsnl, az addig vgrehajtott cselekvsek fggvnyben. Ismt durvn fogalmazva, a
cselekvsek azok, melyeknek az elfelttelei teljeslhetnek az adott idlpsben attl fggen, hogy aktulisan
mely literlok teljeslnek. Azrt mondjuk, hogy durvn, mert a tervksztsi grf csak a cselekvsek kztti
lehetsges negatv klcsnhatsok egy korltozott rszhalmazt tartalmazza, ezrt a tervksztsi grf optimista
lehet a literl teljestshez szksges minimlis lpsek szmval kapcsolatban. Mindazonltal a tervksztsi
grfban ez a lpsszm egy j becsls arra, hogy milyen nehz egy literlt teljesteni a kiindulsi llapotbl.
Mg fontosabb, hogy a tervksztsi grfot gy definiltuk, hogy knnyen elkszthet legyen.
A tervksztsi grf csak tletlogikai tervksztsi problmkra alkalmazhat olyanokra, melyek nem
tartalmaznak vltozkat. Ahogy a 11.1. alfejezetben emltettk, mind a STRIPS, mind az ADL reprezentci
tletlogikra alakthat. A nagyszm entitst tartalmaz problmkat ez jelentsen felduzzaszthatja a
350
Created by XMLmind XSL-FO Converter.
Tervkszts
cselekvssmk szmban. Ennek ellenre a tervksztsi grfok hatkony eszkznek bizonyultak a nehz
tervksztsi problmk megoldsban.
A tervksztsi grfokat egy egyszer pldn mutatjuk be. (Az sszetettebb feladatok olyan grfhoz vezetnek,
amelyek nem frnnek ki egy oldalra.) A 11.11. bra a feladatot, mg a 11.12. bra az ehhez tartoz grfot
mutatja. Az S0 llapotszintrl indulunk, ami a problma kiindul llapotnak felel meg. Ezt az A0
cselekvsszinttel folytatjuk, amibe azokat a cselekvseket helyezzk, melyek elfelttelei az elz szinten
teljeslnek. Minden cselekvs ssze van ktve az S0-ban tallhat elfeltteleivel, illetve az S1-ben tallhat
kvetkezmnyeivel, ami ebben az esetben az S0-ban nem szerepl literlok bevezetst jelenti S1-ben.
A tervksztsi grfnak a nem cselekvst ugyangy kell reprezentlni, mint a cselekvseket. Ez annyit tesz, hogy
a szitucikalkulus keretaximinak megfelel mkdsre van szksg, ami alapjn egy literl kt llapon
keresztl igaz maradhat, ha nincs ezt mdost cselekvs. Egy tervksztsi grfban ezt megrz cselekvsekkel
(persistence actions) oldjuk meg. Minden pozitv s negatv C literlhoz egy megrz cselekvst szrunk be C
elfelttellel s C kvetkezmnnyel. A 11.12. bra az A0 szinten egyetlen vals cselekvst az Eszik(Sti)-t
tartalmazza, kt megrz cselekvssel, amit kicsi ngyzetek jellnek.
Az A0 tartalmazza az sszes cselekvst, ami az S0 llapotban elfordulhat, de ugyanilyen fontos, hogy rgzti a
cselekvsek kztti tkzseket is, amelyek megakadlyozzk, hogy egyszerre trtnjenek. A 11.12. bra szrke
vonalai ezeket a klcsns kizrsi (mutual exclusions vagy mutex) kapcsolatokat jellik. Pldul az
Eszik(Sti) klcsns kizrsban van a Van(Sti) vagy a Megevett(Sti) megrzsvel. Hamarosan ltjuk, hogy
a mutex kapcsolatokat hogyan szmthatjuk.
Az S1 az sszes olyan literlt tartalmazza, ami az A0 szint akciinak brmely rszhalmazt vlasztva elrhet.
Szintn tartalmaz mutex kapcsolatokat (szrke vonalakat) jellve az olyan literlokat, melyek nem
teljeslhetnek egyszerre, a vlasztott cselekvsektl fggetlenl. Pldul a Van(Sti) s a Megevett(Sti)
klcsnsen kizrjk egymst. Az A0 kivlasztott cselekvseitl fggen az eredmny vagy az egyik vagy a
msik lehet, de a kett egyszerre nem. Ms szavakkal az S1, csakgy, mint a regresszis llapottr-keress, tbb
llapotot reprezentl, a kizrsi kapcsolatok pedig knyszerek, melyek a lehetsges llapotok halmazt
definiljk.
351
Created by XMLmind XSL-FO Converter.
Tervkszts
s ez gy megy tovbb. Az Si llapot- s az Ai cselekvsszintek kztt mozgunk, egszen addig, mg elrnk egy
szintet, ahol kt egymst kvet szint azonos. Ekkor azt mondjuk, hogy a grf kiegyenltdtt (leveled off).
Minden egymst kvet szint azonos, gy tovbbi kiterjesztsre nincsen szksg.
Egy olyan struktrt kaptunk, ahol az Ai szint tartalmaz minden Si-ben alkalmazhat cselekvst, a knyszerekkel
egytt, melyek megmondjk, hogy melyik cselekvspr nem hajthat vgre egyidejleg. Minden Si szint
tartalmazza az sszes literlt, ami az Ai1 sszes lehetsges cselekvshalmaznak hatsra teljesl, a
knyszerekkel egytt, amelyek a nem lehetsges literlprokat jellik ki. Fontos megjegyezni, hogy a
tervksztsi grf elksztsi folyamathoz nem kell vlasztanunk a cselekvsek kztt, ami kombinatorikus
keresst eredmnyezne. Ezzel szemben, a tervksztsi grf konstrukcija csak a lehetetlen vlasztsokat rgzti,
mutex kapcsolatok felhasznlsval. Egy ilyen tervksztsi grf elksztsnek bonyolultsga egy
alacsonyrend polinomilis komplexits a cselekvsek szmt tekintve, ahol az llapottr exponencilis a
literlok szmban.
Most mutex kapcsolatokat definilunk, mind a cselekvsek, mind a literlok szmra. Egy adott szinten, a mutex
kapcsolat akkor rvnyes kt cselekvs kztt, ha a kvetkez hrom felttel valamelyike fennll:
Inkonzisztens hatsok: egy cselekvs neglja egy msik kvetkezmnyt. Pldul az Eszik(Sti) s a
Van(Sti) megrzse inkonzisztens hats, mert a Van(Sti) kvetkezmny tekintetben ellenttesek.
Interferencia: egy cselekvs egyik kvetkezmnye a neglsa egy msik cselekvs elfelttelnek. Pldul az
Eszik(Sti) interferl a Van(Sti) megrzsvel, mert neglja az elfelttelt.
Versenyhelyzet: egy cselekvs elfelttele klcsnsen kizr egy msik elfelttelvel. Pldul a St(Sti) s
az Eszik(Sti) mutexek, mert versenyeznek a Van(Sti) elfelttel tekintetben.
Kt azonos szineten lv literl kztt mutex kapcsolat ll fenn, ha az egyik a msik negltja, vagy brmely
lehetsges cselekvspr, amely a kt literlt elrheti, egymst klcsnsen kizr. Ezt az llapotot inkonzisztens
httrnek nevezzk. Pldul a Van(Sti) s a Megevett(Sti) kizrjk egymst S1-ben, mert az egyetlen md a
Van(Sti) teljestsre egy megrz cselekvs, ami mutex a Megevett(Sti) egyetlen elrsi lehetsgvel,
nevezetesen az Eszik(Sti) cselekvssel. Az S2 szinten a kt literl mr nem mutex, mert j elrsi lehetsgek
vannak hozzjuk, mint a St(Sti) s a Megevett(Sti) megrz cselekvse, melyek nem zrjk ki egymst.
Tervkszts
Kvessk vgig a GRAPHPLAN mkdst a 11.1. alfejezet kerkcsere problmjn! A teljes grf a 11.14. brn
lthat. A GRAPHPLAN els lpsben inicializlja a tervksztsi grfot egy egyszint (S0 szint) grfra, ami a
kiindulsi llapot t literljt tartalmazza. Az Ott(Ptkerk, Tengely) clliterl nincs jelen az S0-ban, ezrt nem
kell meghvnunk a MEGOLDS-KINYERST, hiszen biztosak vagyunk benne, hogy mg nincs megolds. Ehelyett
a GRF-BVTS hozzad hrom cselekvst, melyeknek az elfelttele mr teljesl az S0 szinten (pldul az
sszes cselekvs, kivve a Felszerel(Ptkerk, Tengely) cselekvst). Hozzadja tovbb a megrzcselekvseket S0 sszes literljhoz. A cselekvsek kvetkezmnyeit az S1 szinthez adjuk hozz. A GRFBVTS ezek utn mutex kapcsolatokat keres, s hozzadja ezeket a grfhoz.
353
Created by XMLmind XSL-FO Converter.
Tervkszts
Az Ott(Ptkerk, Tengely) cselekvs mg mindig nincs jelen az S1 llapotban, ezrt most sem hvjuk meg a
MEGOLDS-KINYERS lpst. A GRF-BVTS hvssal a 11.14. brn lthat tervksztsi grfot kapjuk. Most,
hogy a cselekvsek teljes sklja rendelkezsre ll, ideje nhny pldt nzni a mutex kapcsolatokra s a
hatsaikra:
Nem konzisztens hatsok: az Eltvolt(Ptkerk, Csomagtart) mutex kapcsolatban van az Otthagyjszakra
cselekvssel, mert az egyik kvetkezmnye az Ott(Ptkerk, Fld), mg a msik ennek negltja.
Interferencia: az Eltvolt(Ptkerk, Tengely) mutex az Otthagyjszakra cselekvssel, mert az egyiknek
elfelttele az Ott(Laposkerk, Tengely), mg a msiknak ennek negltja a kvetkezmnye.
Versenyhelyzet: a Felszerel(Ptkerk, Tengely) mutex az Eltvolt(Laposkerk, Tengely) cselekvssel, mert az
egyiknek elfelttele az Ott(Laposkerk, Tengely), mg a msik ennek negltja.
Inkonzisztens tart: az Ott(Ptkerk, Tengely) s az Ott(Laposkerk, Tengely) klcsnsen kizrak az S2ben, mert az Ott(Ptkerk, Tengely) csak a Felszerel(Ptkerk, Tengely) cselekvssel rhet el, ami mutex a
megrz cselekvssel, mely az Ott(Laposkerk, Tengely) egyetlen elrse. A mutex kapcsolatok gy azonnal
rzkelik a konfliktust, ami abbl addik, hogy kt objektumot ugyanazon idpontban azonos helyre
prblunk tenni.
Ez alkalommal visszamegynk a ciklus kezdetre. A cl minden literlja jelen van S2-ben, s egyik sem ll
klcsns kizrsban egyetlen msikkal sem. Ez azt jelenti, hogy egy megolds ltezhet, s a MEGOLDSKINYERSmegtallhatja. Lnyegben a MEGOLDS-KINYERS egy ktrtk knyszerkielgtsi problmt old
meg, melynek vltozi a szintek cselekvsei, s az rtkeik pedig azt jelzik, hogy benne vannak-e vagy
nincsenek benne a tervben. Ehhez egy egyszer knyszerkielgtsi algoritmust hasznlhatunk, vagy
definilhatjuk a MEGOLDS-KINYERS-t mint egy keressi problmt. Itt a keress minden llapota a
kielgtetlen clok egy halmazt tartalmazza, valamint egy mutatt a tervksztsi grf egy szintjre. Ezt a
keressi problmt a kvetkezkppen definiljuk:
A kiindulsi llapot a tervksztsi grf utols szintje (Sn) a tervksztsi problma cljaival egyetemben.
Az Si szint llapotban rendelkezsre ll cselekvsek sszessge, az Ai1 cselekvseinek azon
konfliktusmentes rszhalmaza, melyek kvetkezmnyei elrik az llapotban lv clokat. Az eredmnyknt
elll llapot szintje Si1, cljai pedig a kivlasztott cselekvsek elfelttelei. A konfliktusmentessgen
olyan cselekvsek halmazt rtjk, amelyek kztt nincs kett, amelyek klcsnsen kizrnk egymst, s az
elfeltteleik kztt sem szerepelnek klcsnsen kizr prok.
A cl, hogy elrjnk az S0 szinten egy llapotot gy, hogy minden cl teljesljn.
354
Created by XMLmind XSL-FO Converter.
Tervkszts
355
Created by XMLmind XSL-FO Converter.
Tervkszts
Mivel a cselekvsek s a literlok nvekednek, a klcsns kizrsok cskkennek, s mivel csak vges szm
cselekvs s literl van, minden tervksztsi grf szksgszeren kiegyenltdik azaz minden egymst kvet
szint azonos lesz. Ha hinyzik a problma egy clja, vagy a clok kztt vannak klcsnsen kizrk, miutn a
grf kiegyenltdtt, akkor a problma soha nem oldhat meg, gy lellthatjuk a GRAPHPLAN algoritmust, s
hibval trhetnk vissza. Ha a grf kiegyenltdik, s minden cl jelen van kizrsok nlkl, de a MEGOLDSKINYERS sikertelen a megolds megtallsban, akkor lehet, hogy vges lpsszmban bvtennk kell a
grfot, de vgezetl megllhatunk. A meglls problmakre ennl sszetettebb, amit itt nem trgyalunk.
5. Tervkszts tletlogikval
A 10. fejezetben lthattuk, hogy a tervkszts elvgezhet a szitucikalkulus egy ttelnek bizonytsval. A
ttel azt mondja, hogy adott kiindul llapotra s kvetllapot-aximkra, amelyek a cselekvsek
kvetkezmnyeit rjk le, a cl egy adott cselekvssorbl add helyzetben igaz lesz. Ezt a megkzeltst mr
1969-ben sem talltk elgg hatkonynak rdekes tervek megtallsra. Napjaink fejlesztsei az tletlogikhoz
ksztett hatkony magyarzatad algoritmusokra (lsd 7. fejezet) ismt felkeltettk az rdekldst a tervkszts
logikai magyarzatksztsi megkzeltsre.
Az ebben a fejezetben trgyalt megkzelts a ttelbizonyts helyett egy cselekvssor kielgthetsgnek
(satisfiability) vizsglatn alapul. tletlogikai mondatok modelljt fogjuk megtallni, melyek a
kvetkezkppen nznek ki:
kiindul llapot minden lehetsges cselekvslers cl
(Emlkezznk arra, hogy az Ott(P1, SFO)0 egy atomi szimblum!) Mivel az tletlogika nem hasznlja a zrt
vilg felttelezst, ezrt a kiindul llapotban definilnunk kell a nem igaz tletlogikai lltsokat is. Ha nhny
llts nem ismert a kiindul llapotban, akkor ezek maradhatnak meghatrozatlanok (nylt vilg felttelezs).
Ebben a pldban az
Ott(P1, JFK)0 Ott(P2, SFO)0
kiindul llapotot specifikljuk. A clt magt egy megadott idlpshez kell kapcsolni. Mivel nem tudjuk a
priori, hogy hny lpsre van szksg a cl elrshez, megprblhatjuk felttelezni, hogy a cl igaz a kiindul
llapotban, T = 0 idpontban. Azaz a kvetkezt lltjuk: Ott(P1, JFK)0 Ott(P2, SFO)0. Ha ez sikertelen, jra
prblkozunk T = 1-gyel, s gy tovbb, amg a legkisebb megfelel tervhosszt el nem rjk. T minden rtkre
a tudsbzis a 0. idponttl a T-ig tart lpseket fed mondatokat fogja tartalmazni. Hogy biztostsuk a lellst,
egy nknyes Tmax fels korltot kell lltanunk. Ezt az algoritmust mutatja a 11.15. bra. Egy msik lehetsges
megkzeltst, mely elkerli a tbbszrs megoldsi ksrleteket, a 11.17. feladatban trgyalunk.
Tervkszts
axima. Ennek jelentse, hogy a P1 repl a JFK-n lesz az 1-es idpillanatban, ha a JFK-n volt a 0.
idpillanatban, s onnan nem replt el, vagy ha az SFO-n volt a 0. idpillanatban, s elreplt a JFK-ra. Egy
ilyen aximra minden egyes replgphez, repltrhez s idpillanathoz szksgnk van. Mindezeken tl
minden egyes hozzadott repltr egy j kiindul, illetve ott vgzd tvonalat ad az sszes repltrhez, ezrt
tovbbi diszjunkcikat ad az sszes axima jobb oldalhoz.
Ha ezek az aximk megvannak, akkor egy kielgthetsgi algoritmust futtathatunk a terv megtallsra. Kell,
hogy legyen olyan terv, ami a clt a T = 1 idpillanatban elri, nevezetesen az a terv, melyben a kt replgp
helyet cserl. Tegyk fel, hogy a tudsbzis a kvetkez:
kiindul llapot kvet llapot aximk cl1 (11.2)
igaz, s minden ms cselekvsszimblum hamis, modellje a tudsbzisnak. Eddig itt minden rendben. Vannak
ms lehetsges modellek, melyeket a kielgthetsgi algoritmus visszaadhat? Valjban igen. Ezen modellek
mindegyike kielgt terv? Sajnos nem. Vegyk pldul a
Repl(P1, SFO, JFK)0, a Repl(P1, JFK, SFO)0 s a Repl(P2, JFK, SFO)0
cselekvsszimblumok ltal specifiklt meglehetsen butcska tervet. Ez a terv buta, mert a P1 repl az SFOrl indul, ezrt a Repl(P1, JFK, SFO)0 cselekvs vgrehajthatatlan. Mindazonltal a terv modellje a (11.2)
egyenlet mondatnak! Ez annyit jelent, hogy megfelel mindennek, amit eddig a problmrl lltottunk. Hogy
megrtsk mirt, egy kicsit kzelebbrl meg kell vizsglnunk, hogy a kvetkez llapot aximk mit mondanak
el a cselekvsekrl, melyeknek az elfelttelei nem teljeslnek (mint a (11.1) egyenletben). Az aximk
helyesen rjk le, hogy semmi sem trtnik, ha egy ilyen cselekvst vgrehajtunk (lsd 11.15. feladat), de nem
lltjk, hogy egy ilyen cselekvs nem hajthat vgre! Hogy elkerljk az illeglis cselekvseket tartalmaz
357
Created by XMLmind XSL-FO Converter.
Tervkszts
tervek ksztst, tovbbi elfelttel aximkat (precondition axioms) kell felvennnk, melyek biztostjk,
hogy egy cselekvs megjelenshez az elfeltteleknek teljeslni kell.6 Pldul szksgnk van az
Repl(P1, JFK, SFO)0 Ott(P1, JFK)0
aximra, mert az Ott(P1, JFK)0 hamis a kiindul llapotban, gy ez az axima biztostja, hogy a Repl(P1, JFK,
SFO)0 minden modellben szintn hamis legyen. Az elfelttel aximk hozzadsval mr csak pontosan egy
modell van, ami teljesti az sszes aximt, amikor a clt az 1-es idpillanatban rjk el, nevezetesen az a
modell, melyben a P1 replgp a JFK-ra, a P2 replgp pedig az SFO-ra repl. Vegyk szre, hogy ez a
megolds kt prhuzamos cselekvst tartalmaz! Csakgy, mint a GRAPHPLAN vagy a rszben rendezett
tervkszts esetn.
Tovbbi meglepetsekre szmthatunk, amikor egy j replteret illesztnk be, a LAX-ot (Los Angeles
repltere). Most minden replgphez minden llapotban kt megengedett cselekvs is tartozik. Amikor egy
kielgthetsgi algoritmust futtatunk, gy talljuk, hogy a Repl(P1 SFO, JFK)0, a Repl(P2, JFK, SFO)0 s a
Repl(P2, JFK, LAX)0-bl ll modell kielgti az aximkat. Azaz a kvet llapot aximk s az elfelttel
aximk megengedik, hogy egy replgp egyszerre kt clllomsra is replhessen! A kiindul llapot a P2
mindkt repltjnak elfeltteleit teljesti, gy a kvet llapot aximk szerint a P2 az SFO-n s a LAX-on
tallhat az 1-es idpillanatban, azaz a cl teljesl. Nyilvnval, hogy tovbbi aximkat kell felvennnk, hogy
kizrjuk ezeket a hibs megoldsokat. Az egyik megkzelts, hogy cselekvskizr aximkat (action
exclusion axioms) vesznk fel, melyek meggtoljk az egyidej cselekvseket. Pdul teljes kizrst rhetnk
el, ha az sszes
(Repl(P2, JFK, SFO)0 Repl(P2, JFK, LAX)0)
alak aximt felvesszk. Ezek az aximk biztostjk, hogy semelyik kt cselekvs ne eshessen azonos
idpontra. Ezek kizrjk a hibs terveket, hatsukra minden terv teljesen rendezett lesz. Ez elveszti a rszben
rendezett tervek rugalmassgt, s azltal, hogy megnveli a terv lpsszmt, a szmtsi id is
meghosszabbodhat.
A teljes kizrs helyett alkalmazhatunk csupn rszleges kizrst, amikor az egyidej cselekvseket csak akkor
zrjuk ki, ha klcsnhatsba kerlnek. A felttelek a mutex cselekvsek megfeleli: kt cselekvs nem hajthat
vgre egyidejleg, ha az egyik neglja a msik egy elfelttelt vagy kvetkezmnyt. Pldul a Repl(P2, JFK,
LAX)0 s a Repl(P2, JFK, SFO)0 egytt nem kvetkezhet be, mert mindkett neglja a msik elfelttelt.
Msrszrl azonban a Repl(P2, JFK, SFO)0 s a Repl(P2, JFK, SFO)0 egytt is bekvetkezhet, hiszen a jratok
nem zavarjk egymst. A rszleges kizrs a teljes rendezs knyszere nlkl kikszbli a hibs terveket.
A kizrsi aximk nha nagyon buta eszkznek tnnek. Ahelyett hogy kiktnnk, hogy egy gp nem replhet
egyszerre kt reptrre, mondhatnnk egyszeren, hogy egyetlen trgy sem lehet egyszerre kt helyen:
p, x, y, t x y (Ott(p, x)t Ott(p, y)t)
Ez a tny a kvet llapot aximkkal kombinlva, azt impliklja, hogy egy repl nem replhet egyszerre kt
reptrre. Az ilyen tnyeket llapotkorltozsoknak (state constraints) nevezzk. Az tletlogikban
termszetesen meg kell adnunk minden egyes llapotkorltozs sszes alappldnyt. A repls feladatra az
llapotkorltozs elegend az sszes hibs terv kizrshoz. Az llapotmegktsek gyakran sokkal tmrebbek,
mint a cselekvskizrsi aximk, ezek azonban a problma eredeti STRIPS reprezentcijbl nem mindig
vezethetk le knnyedn.
sszefoglalva teht a kielgthetsgi tervkszts, a kiindul llapotot, a clt, a kvet llapot aximkat, az
elfeltteleket, valamint a cselekvskizrsok vagy az llapotaximk egyikt tartalmaz mondathoz tartoz
modellek megtallst jelenti. Megmutathat, hogy az aximk ezen halmaza elgsges, abban az rtelemben,
hogy a tovbbiakban nincsenek hibs megoldsok. Az tletlogikai mondatot kielgt brmely modell
megfelel megoldsa az eredeti problmnak, azaz a terv minden sorba rendezse egy megengedett
cselekvssor, ami a clhoz vezet.
Figyeljk meg, hogy az elfelttel aximk felvtele azt jelenti, hogy nem kell a kvet llapot aximknl a cselekvsekhez
elfeltteleket felvennnk.
6
358
Created by XMLmind XSL-FO Converter.
Tervkszts
Az els felttel szerint a P1 a JFK-n lesz, ha a 0. idpontban ott volt, s nem replt el egyetlen msik vrosba
sem. A msodik azt mondja, hogy ott lesz, ha mindegy, hogy honnan, de a JFK-ra repl. A felosztsi
szimblumok hasznlatval, egyszeren elhagyhatjuk azon argumentumokat, melyek rtke nem szmt:
Ott(P1, JFK)1 (Ott(P1, JFK)0 Repl1(P1)0 Repl2(JFK)0) Repl1(P1)0
Repl3(JFK)0
Vegyk szre, hogy az SFO s a LAX mr nem szerepel az aximban. ltalnosabban a felosztsi
szimblumoknak ksznheten a kvet llapot aximk mrete fggetlenn vlik a replterek szmtl.
Hasonl redukci trtnik az elfelttel s a cselekvskizrsi aximkkal (lsd 11.16. feladat). A korbban
bemutatott 10 idlps, 12 repl s 30 reptr esetben a teljes cselekvskizrsi axma mrete 583 milli
klzrl 9360 klzra cskken.
A mdszernek egyetlen htultje van: a felosztsi szimblum reprezentci nem engedi meg a prhuzamos
cselekvseket. Vegyk a Repl(P1, SFO, JFK)0 s a Repl(P2, JFK, SFO)0 prhuzamos cselekvseket. A
felosztott megadsra alaktva a
Repl1(P1)0 Repl2(SFO)0 Repl3(JFK)0
Repl1(P2)0 Repl2(JFK)0 Repl3(SFO)0
kifejezst kapjuk. Innentl mr nem llapthat meg mi trtnt! Tudjuk, hogy P1 s P2 replt, de nem tudjuk
azonostani a jratok kiindul s clllomsait. Ez annyit tesz, hogy egy teljes cselekvskizrsi aximt kell
hasznlni, annak korbban jelzett htrnyaival.
A kielgthetsgen alapul tervksztk nagyon nagy tervksztsi problmkat kpesek kezelni pldul a
tbbtucatnyi dobozbl ll kockavilg problma 30 lpses tervt. A propozcis kdols mrete, valamint a
megolds kltsge nagymrtkben problmafgg, de a legtbb esetben az tletlogikai aximk t rolshoz
szksges memriamret a szk keresztmetszet. Ennek a kutatsnak egy rdekes eredmnye, hogy a
359
Created by XMLmind XSL-FO Converter.
Tervkszts
Tervkszts
7. sszefoglals
Ebben a fejezetben a tervksztsi feladatot determinisztikus s teljesen megfigyelhet krnyezetek esetn
definiltuk. Bemutattuk a tervksztsi feladatok lersra hasznlt fbb reprezentcikat, valamint szmos
algoritmikus megkzeltst a megoldsukra. Idzzk fel a fontosabb lltsokat:
A tervkszt rendszerek olyan problmamegold algoritmusok, melyek llapotok s cselekvsek explicit
tletlogikai (vagy elsrend) reprezentciin mkdnek. Ezek a lersok lehetv teszik hatkony
heurisztikk szrmaztatst, valamint ers s rugalmas algoritmusok kifejlesztst a problmamegoldshoz.
A STRIPS nyelv az elfelttelek s kvetkezmnyek segtsgvel rja le a cselekvseket, valamint a kiindulsi
s clllapotokat pozitv literlok konjunkcijaknt adja meg. Az ADL nyelv lazt ezeken a megktseken,
megengedi a diszjunkcit, a neglst s a kvantorokat.
Az llapottr-keress trtnhet elrefel: progreszv (progression) vagy htrafel: regresszv (regression).
Hatkony heurisztikk szrmaztathatk a rszclok fggetlensgt felttelezve s a tervksztsi feladat
klnbz gyengtseivel.
A rszben rendezett tervkszt (RRT) algoritmusok a tervek terben keresnek anlkl, hogy cselekvsek
teljesen rendezett sorozatra jutnnak. A cltl visszafel mkdnek a rszclok elrshez szksges
cselekvseknek a tervhez val hozzadsval. Ezek az algoritmusok klnsen hatkonyak az oszd meg s
uralkodj megkzeltssel kezelhet problmkra.
Egy tervksztsi grf (planning graph) megalkothat inkrementlisan a kiindul llapotbl elindulva.
Minden egyes rteg az adott idpillanatban vgrehajthat szszes cselekvs s literl halmazt tartalmazza,
rgzti a klcsns kizrsokat vagy mutexeket, azaz olyan literlok s cselekvsek kztti relcikat, melyek
egyszerre nem kvetkezhetnek be. A tervksztsi grfok hasznos heurisztikkra vezetnek az llapottr s a
rszben rendezett tervksztk esetn, s kzvetlenl felhasznlhatk a GRAPHPLAN algoritmusban.
A GRAPHPLAN algoritmus a tervksztsi grfot dolgozza fel visszafel keresst alkalmazva a terv
kinyershez. Lehetsget biztost tovbb mg a cselekvsek kztt bizonyos rszben rendezsekre.
A SATPLAN algoritmus a tervksztsi problmt tletlogikai aximkra fordtja, s egy kielgthetsgi
algoritmust hasznl a helyes tervnek megfelel modell megtallsra. Szmos klnbz tletlogikai
reprezentcit fejlesztettek ki klnbz mrtk tmrsggel s hatkonysggal.
A tervkszts f megkzeltsei mindegyiknek vannak nehzsgei, s egyelre nincs egyetrts abban, hogy
melyik a legjobb. A versengs s a mdszerek tvzse komoly elrehaladst eredmnyezett a tervkszt
rendszerek hatkonysgban.
Tervkszts
trtnelmi ttekintst adnak a STRIPS projektrl, s feltrjk ennek kapcsolatait az jabb tervksztsi
trekvsekkel (Fikes s Nilsson, 1993).
A STRIPS-ben hasznlt cselekvsreprezentcinak sokkal nagyobb hatsa volt, mint algoritmikus
megkzeltsnek. Ezt kveten majdnem minden tervkszt rendszer hasznlta a STRIPS nyelv ilyen vagy
olyan mdostsait. Sajnos a klnbz vltozatok elburjnzsa szksgtelenl megneheztette az
sszehasonltsokat. Az id mlsval jobban megrtettk az egyes formalizmusok korltait s htrnyait. A
cselekvsler nyelv (Action Description Language ADL) (Pednault, 1986) laztotta a STRIPS nyelv nhny
megktst, s lehetv tette a valsghoz kzelibb problmk lerst. Nebel az ADL lerst STRIPS lersra
fordt smkat vizsglja (Nebel, 2000). A problmatr ler nyelvet (Problem Domain Description Language
PDDL) (Ghallab s trsai, 1998) egy szmtgp ltal rthet szabvnyos szintaxisknt vezettk be a STRIPS, az
ADL s egyb nyelvek lersra. A PDDL-t 1998-tl az AIPS konferencin zajl tervksztsi versenyek
szabvnyos nyelveknt hasznltk.
Az 1970-es vek elejnek tervkszti ltalban teljesen rendezett cselekvssorokkal dolgoztak. A
problmadekompozcit gy rtk el, hogy minden rszclhoz egy rsztervet ksztettek, majd ezeket
valamilyen sorrendben sszefztk. Hamarosan felfedeztk, hogy ez a megkzeltst, melyet Sacerdoti lineris
tervksztsnek (linear planning) nevezett (Sacerdoti, 1975), nem teljes. Nem kpes megoldani nhny nagyon
egyszer problmt, mint pdul a Sussman-anomlit (lsd 11.11. feladat), amit Allen Brown a HACKER
rendszerrel vgzett kutatsai sorn fedezett fel (Sussman, 1975). Egy teljes tervksztnek meg kell engedni egy
mondatban a klnbz rsztervekbl szrmaz cselekvsek sszefslst (interleaving). A sorrendezhet
rszclok alaptlete (Korf, 1987) pontosan megfeleltethet azon problmk halmaznak, melyekre az
szszefslsre nem alkalmas tervksztk teljesek.
Az sszefslsi problma egyik megoldsa a clregresszis tervkszts volt, ami egy olyan technika, melyben
egy teljesen rendezett terv lpseit a rszclok kztti konfliktusok elkerlse rdekben jrarendezzk. Ezt
Waldinger vezette be (Waldinger, 1975), s Warren WARPLAN rendszerben (Warren, 1974) szintn
felhasznltk. A WARPLAN-nel kapcsolatban szintn kiemelend, hogy ez volt az els tervkszt, melyet logikai
programozsi nyelven (Prolog) rtak, valamint az egyik legjobb plda arra a kiemelked gazdasgossgra, ami a
logikai programozssal nyerhet: a WARPLAN sszesen szz kdsor, azaz csak tredke az abban az idben
ismert hasonl tervksztk mretnek. Az INTERPLAN (Tate, 1975a; 1975b) a Sussman-anomlia s hasonl
problmk elkerlse rdekben, szintn megengedte a tervlpsek tetszleges sszefslst.
A rszben rendezett tervkszts alaptletei tartalmazzk az tkzsek rzkelst (Tate, 1975a) s az elrt
felttelek klcsnhatsoktl val vdelmt (Sussman, 1975). A rszben rendezett tervek (melyeket akkor
feladathlknak task network neveztek) ksztst a NOAH tervkszt (Sacerdoti, 1975; 1977) s Tate
NONLIN rendszere vezette be (Tate, 1975b; 1977).7
A kvetkez hsz v kutatsaiban a rszben rendezett tervkszts dominlt, mialatt azonban a problmakrt
szles krben nem rtettk. A TWEAK (Chapman, 1987) ezen idszak tervksztsi munkjnak logikai
reprezentcija s egyszerstse volt. Chapman felrsa elgg tiszta volt ahhoz, hogy bizonythat legyen a
tervksztsi problmk klnbz megfogalmazsainak teljessge s kvethetetlensge (NP-nehzsge s eldnthetetlensge). Chapman munkja egy teljes rszben rendezett tervkszt els egyszer s olvashat
lersra vezetett (McAllester s Rosenblitt, 1991). A McAllester s Rosenblitt SNLP-nek (Soderland s Weld,
1991) nevezett algoritmusnak implementcija szles krben elterjedt, s elsknt tette szmos kutat szmra
lehetv a rszben rendezett tervksztk megrtst s kutatst. Az ebben fejezetben korbban bemutatott
RRT algoritmus az SNLP-n alapul.
Weld csoportja fejlesztette ki az UCPOP-ot is (Penberthy s Weld, 1992), az els tervksztt ADL-ben
kifejezett problmkra. Az UCPOP a kielgtetlen-clok-szma heurisztikt alkalmazta. Valamivel gyorsabban
futott, mint az SNLP, de nagyon ritkn volt kpes nhny tucat lpsnl tbbet tartalmaz tervek megtallsra.
Br javtott heurisztikkat is kifejlesztettek az UCPOP mdszerhez (Joslin s Pollack, 1994); (Gerevini s
Schubert, 1996) az 1990-es vekben, a gyorsabb mdszerek megjelensvel a rszben rendezett tervksztk
httrbe szorultak. Nguyen s Kambhampati a mdszer visszatrst javasoltk (Nguyen s Kambhampati,
2001): a tervksztsi grfbl megfelel heurisztikk szrmaztatsval a REPOP tervksztjk jobban
sklzhat, mint a GRAPHPLAN, tovbb ez vetlytrsa lett a leggyorsabb llapottr-tervksztknek is.
A terminolgia kiss zavaros. Sok szerz a nemlineris (nonlinear) jelzt a rszben rendezett rtelemben hasznlja. Ez kiss
klnbzik Sacerdotti eredeti szhasznlattl, aki ezt az sszefslt tervekre hasznlta.
7
362
Created by XMLmind XSL-FO Converter.
Tervkszts
Avrim Blum s Merrick Furst felpezsdtette a tervkszts terlett GRAPHPLAN rendszervel (Blum s Furst,
1995; 1997), ami tbb nagysgrenddel gyorsabb volt az akkori rszben rendezett tervksztknl. Ms
grftervez rendszerek, mint az IPP (Koehler s trsai, 1997), a STAN (Fox s Long, 1998) s az SGP (Weld s
trsai, 1998) hamarosan kvettk. Egy kicsivel korbban Ghallab s Laurelle a tervkszt grfhoz nagyon
hasonl adatstruktrt fejlesztettek ki (Ghallab s Laurelle, 1994). Az IXTET rszben rendez tervksztjk az
adatstruktrt a keress irnytsra szolgl heurisztikk kinyersre alkalmazta. Nguyen s trsai a tervkszt
grfokbl szrmaztatott heurisztikk nagyon alapos ttekintst adtk (Nguyen s trsai, 2001). A mi tervkszt
grfokrl szl lersunk rszben ezen, rszben pedig Subbarao Kambhampati jegyzetein alapul. Ahogyan mr a
fejezetben emltettk, tbbfle mdon hasznlhat a tervezsi grf a megolds keressnek irnytsra. A 2002es AIPS tervkszt gyztese, az LPG (Gerevini s Serina, 2002), a WALKSAT ltal sztnzve loklis keressi
technikt hasznlt a tervksztsi grf keressre.
A tervkszts mint kielgthetsg s a SATPLAN algoritmus Kautz s Selman javaslata, akiket a
kielgthetsgi problmkra alkalmazott moh loklis keress meglep sikere inspirlt (Kautz s Selman,
1992) (lsd 7. fejezet). Kautz s trsai szintn kutattk a STRIPS aximk tletlogikai reprezentcijnak
klnbz mdjait, s azt talltk, hogy a legtmrebb alakok nem felttlenl vezettek a leggyorsabb
megoldsokra (Kautz s trsai, 1996). Ernst s trsai szisztematikus elemzst hajtottak vgre (Ernst s trsai,
1997), valamint kifejlesztettek egy automatikus fordtt PDDL problmk tletlogikai megadsnak
generlsra. A Kautz s Selman ltal kifejlesztett BLACKBOX tervkszt (Kautz s Selman, 1998) a GRAPHPLAN
s SATPLAN alaptleteit kombinlja.
Az llapottr-tervksztkkel kapcsolatos rdeklds jjledsnek ttrje Drew McDermott UNPOP
programja (McDermott, 1996), amely elsknt javasolta a trlsi listt figyelmen kvl hagy egyszerstett
problmn alapul tvolsg heurisztikt. Az UNPOP nv a rszben rendezett tervksztket illet tlzott figyelem
egyik reakcija volt; McDermott szerint ms megkzeltsek nem kaptk meg a megrdemelt figyelmet. Bonet
s Geffner heurisztikus keres tervksztje (Heuristic Search Planner HSP) s ennek ksbbi leszrmazottjai
(Bonet s Geffner, 1999) elsknt tettk az llapottr-keresst alkalmazhatv nagymret tervksztsi
feladatokra. A mai napig legsikeresebb llapottr-keres Hoffmann FASTFORWARD vagy FF keresje, az AIPS
2000 tervkszt versenynek gyztese (Hoffmann, 2000). Az FF egyszerstett tervksztsi grf heurisztikt
hasznl egy nagyon gyors, az elrefel s a loklis keresst jszeren tvz algoritmussal.
Napjainkban a tervek binris dntsi diagram (binary decision diagram) alak reprezentcija hdt, ami egy
vges automata tmr lersi mdja, melyet a hardververifikcival foglalkoz kzssg rszletesen
tanulmnyozott (Clarke s Grumberg, 1987; McMillan, 1993). A binris dntsi diagramok jellemzinek mint
egy tervksztsi problma megoldsnak val megfelels tulajdonsgnak bizonytsra szmos technika
elrhet. Cimatti s trsai egy ezen a megkzeltsen alapul tervksztt mutattak be (Cimatti s trsai, 1998).
Ms reprezentcikat szintn felhasznltak; pldul Vossen s trsai az egsz programozs tervksztsre val
felhasznlhatsgt vizsglja (Vossen s trsai, 2001).
A dntbizotsg mg nem dnttt, de a klnbz tervksztsi algoritmusok nhny nagyon rdekes
sszevetse mr elrhet. Helmert a tervksztsi problmk szmos osztlyt vizsglja, s megmutatja, hogy az
NP-nehz problmakrkben a megktsalap megkzeltsek, mint a GRAPHPLAN s a SATPLAN bizonyulnak a
legjobbnak, mg a keressalap megkzeltsek azon problmakrkben hasznosak, ahol visszalpsek nlkl
elrhet egy megfelel megolds (Helmert, 2001). A GRAPHPLAN s SATPLAN algoritmusoknak nehzsget
okoznak a sok objektumot tartalmaz problmk, mert ezek miatt sok cselekvsre van szksgk. Az esetek egy
rszben a problma elkerlhet vagy elodzhat, ha a cselekvsek bizonyos rszt csak szksg esetn
generljuk le dinamikusan, ahelyett hogy mr a keress eltt pldnyostannk mindegyiket. Weld a modern
tervkszt algoritmusok kt kitn ttekintst adja (Weld, 1994; 1999). rdekes ltni az eltelt t v vltozsait
az ttekintsekben: az els a rszben rendezett tervksztsre fkuszl, mg a msodik a GRAPHPLAN s SATPLAN
algoritmusokra. A Readings in Planning (Allen s trsai, 1990) a terlet legjobb korbbi cikkeinek minden
rszletre kiterjed antolgija, belertve nhny ttekintst is. Yang a rszben rendezett tervksztk knyv
mret ttekintst adja (Yang, 1997).
A tervkszts kutatsa a megjelenstl kezdve kzponti krdse a mestersges intelligencia kutatsnak, gy a
tervksztsrl szletett cikkek is szmottev rszt kpezik a folyiratok s konferencik anyagnak.
Specializlt konferencikat is rendeznek, mint az International Conference on AI Planning Systems (AIPS), az
International Workshop on Planning and Scheduling for Space vagy a European Conference on Planning.
7.2. Feladatok
363
Created by XMLmind XSL-FO Converter.
Tervkszts
11.1.
rja le a klnbsgeket s hasonlsgokat a problmamegolds s a tervkszts kztt.
11.2.
Adottak a 11.2. bra aximi. Melyek az alkalmazhat konkrt pldnyai a Repl(p, honnan, hova)
cselekvsnek a kvetkez llapotban:
Ott(P1, JFK) Ott(P2, SFO) Repl(P1) Repl(P1)
Repltr(JFK) Repltr(SFO)
11.3.
Nzzk meg, hogyan fordthatunk le egy STRIPS smahalmazt a szitucikalkulus kvet llapot aximira
(lsd 10. fejezet).
Vegyk a Repl(p, honnan, hov) smt. rja le a ReplElfelttel(p, honnan, hov, s) prediktum logikai
defincijt, ami igaz, ha a Repl(p, honnan, hov) elfelttelei teljeslnek az s szituciban.
Ezutn rjuk fel a Ott(p, x, s) kvet llapot aximjt, ami a cselekvssmval azonos informcit
tartalmazza, felttelezve, hogy a Repl(p, honnan, hov) az gens szmra rendelkezsre ll egyetlen
cselekvssma.
Most felttelezzk, hogy van egy tovbbi utazsi lehetsg: Teleportls(p, honnan, hov). Ennek egy
tovbbi elfelttele a Torzult(p), extra kvetkezmnye pedig a Torzult(p). Magyarzza meg, hogyan kell
mdostani a szitucikalkulus tudsbzist.
Vgezetl fejlesszen ki egy ltalnos s pontosan specifiklt megoldst egy STRIPS smahalmaz kvet
llapot axima halmazra val lefordtshoz.
11.4.
Egy majom a majom-s-bann feladattal tallkozik egy laboratriumban, ahol elrhetetlen bannfrtk lgnak
a plafonrl. Van egy doboz, ami lehetv teszi a majom szmra a bann elrst, amennyiben felmszik r.
Kiindulskpp a majom az A-ban van, a bannok a B helyen s a doboz a C-n. A majom s a doboz magassga
Alacsony, de ha a majom a dobozra mszik, magassga Magas lesz, megegyezik a bannok magassgval. A
majom szmra elrhet cselekvsek tartalmazzk a Menj egyik helyrl a msikra, a Tol egy trgyat egyik
helyrl a msikra, a Felmszik egy trgyra, illetve Lemszik egy trgyrl, s a Megfog, illetve Elenged egy
trgyat cselekvseket. A megmarkols a trgy megfogst eredmnyezi, ha a majom s a trgy ugyanazon a
helyen s ugyanabban a magassgban vannak.
a. rja fel a kiindul llapotot.
b. rja le a hat cselekvs defincijt STRIPS alakban.
c. Tegyk fel, hogy a majom meg akarja trflni a tudsokat, akik tezni mentek, azltal hogy megragadja a
bannokat, de a dobozt az eredeti helyn hagyja. rja fel ezt mint ltalnos clt (pldul nem felttelezve,
hogy a doboz szksgszeren a C helyen van) a szitucikalkulus nyelvn. Megoldhat ez egy STRIPS-szer
rendszerrel?
d. A tolsi aximja valsznleg helytelen, mert a trgy tl nehz, gy a pozci azonos marad, ha a Tol
opertort alkalmazzuk. Ez elgazsi vagy rtkelsi feladatra ad pldt? Javtsa ki a feladat lerst, hogy
figyelembe vegye a nehz trgyakat.
11.5.
Magyarzza meg, hogy a htrafel keressben a megelz llapotok generlsnak folyamata mirt nem ignyli,
hogy a cselekvs negatv kvetkezmnyeinek megfelel literlokat is szerepeltessk.
11.6.
364
Created by XMLmind XSL-FO Converter.
Tervkszts
Magyarzza meg, mirt vezet relaxlt problmra a negatv kvetkezmnyek eldobsa egy STRIPS problma
minden cselekvs smjbl.
11.7.
Vizsglja meg a 3. fejezetben szerepl ktirny keress (bidirectional search) defincijt.
a. A ktirny llapottr-keress hasznlata j tlet lenne tervksztshez?
b. s a rszben rendezett tervek terben trtn ktirny keress?
c. Tervezze meg a rszben rendezett tervkszt azon verzijt, melyben egy cselekvs akkor adhat hozz a
tervhez, ha az elfelttelei elrhetk a tervben mr szerepl cselekvsek kvetkezmnyein keresztl.
Magyarzza meg, hogyan kezeljk a konfliktusokat s a rendezsi megktseket. Szksgszeren azonos ez
az algoritmus az llapottrben trtn elrefel keresssel?
d. Vegynk egy rszben rendezett tervksztt, ami kombinlja a c) rszfeladat mdszert azzal az ltalnos
mdszerrel, ahol a nyitott felttelek elrshez cselekvseket adunk a tervhez. Azonos lesz az gy elll
algoritmus a b) rszfeladattal?
11.8.
Ksztse el a 11.2. brn szerepl problma tervksztsi grfjnak 0., 1. s 2. szintjt.
11.9.
Bizonytsa be az albbi tervkszt grfokra vonatkoz lltsokat:
Az a literl, ami nem jelenik meg a grf utols szintjn, nem rhet el.
Egy soros grfban szerepl literl szintkltsge nem lehet nagyobb, mint az t elr optimlis terv kltsge.
11.10.
sszevetettk az llapottrben elre- s htrafel keres tervksztket a rszben rendezett tervksztkkel gy,
hogy az utbbit egy tervtrkeresnek vettk. Magyarzza meg, hogyan tekinthet az elre- s htrafel trtn
llapottr-keress tervtrkeresnek, s mondja meg, mik a tervfinomt opertorok.
11.11.
A 11.16. bra a kockavilg problmt mutatja, ami Sussman-anomliaknt (Sussman anomaly) ismert. A
problmt azrt tekintettk anomlinak, mert az 1970-es vek nem sszefsls tervkszti nem tudtk
megoldani. rjuk fel a problma defincijt STRIPS alakban, s oldjuk meg, kzzel vagy egy tervkszt
programmal. A nemsszefsl tervkszt egy olyan tervkszt, ami ha kt G1 s G2 rszclt kap, akkor vagy
egy G1 elrsre szolgl tervet fz hozz egy G2 elrsre szolgl tervhez, vagy fordtva. Magyarzza meg,
hogy egy nem sszefsl tervkszt mirt nem tudja megoldani a kockavilg problmt.
11.12.
Vegyk a cip s zokni felvtelnek problmjt, ahogy a 11.3. alfejezetben definiltuk. Alkalmazzuk a
GRAPHPLAN algoritmust erre a problmra, s mutassuk meg, hogyan ll el a megolds. Adjuk hozz a kabt s
a kalap felvtelre szolgl cselekvseket. Adjuk meg azt a rszben rendezett tervet, ami megolds, s mutassuk
meg, hogy ennek 180 klnbz sorrendezse van. Mi a 180 klnbz sorrendezs reprezentcijhoz
szksges klnbz tervkszt grf megoldsok minimlis szma?
365
Created by XMLmind XSL-FO Converter.
Tervkszts
11.17. bra - Shakey vilga. Shakey kpes egy szobn bell mozogni, t tud menni a
szobk kztti ajtkon, fel tud mszni trgyakra, el tudja tolni a mozdthat trgyakat,
valamint a villanyt tudja kapcsolni.
366
Created by XMLmind XSL-FO Converter.
Tervkszts
11.13.
Az eredeti STRIPS programot a Shakey robot irnytsra ksztettk. A 11.17. bra a Shakey vilgnak egy
vltozatt mutatja, melyben ngy szoba sorakozik egy folyos mentn, melyek mindegyiknek van egy ajtaja s
van benne egy villanykapcsol.
Shakey vilgnak cselekvsei tartalmazzk az egyik helyrl a msikra val mozgst, mozgathat trgyak (mint
dobozok) eltolst, szilrd testekre (mint dobozokra) val fel- s lemszst, s villanykapcsolk fel-, illetve
lekapcsolst. A robot nmagban soha nem volt elg gyes ahhoz, hogy egy dobozra msszon vagy egy
kapcsolt tkapcsoljon, de a STRIPS tervkszt kpes a robot kpessgein tlmutat terveket tallni s
megadni. Shakey hat cselekvse a kvetkez:
A Megy(x, y), ami felttelezi, hogy Shakey x-ben van, valamint az x s y helyek ugyanazon szobban vannak.
Konvenci alapjn a kt szoba kztti ajt mindkt szobban benne van.
367
Created by XMLmind XSL-FO Converter.
Tervkszts
A b doboz eltolsa x pozcibl ugyanazon szoba y pozcijba: Tol(p, x, y). Szksgnk lesz a Doboz
prediktumra s konstansokra a dobozokhoz.
Dobozra felmszs: Felmszik(b); dobozrl lemszs: Lemszik(b). Szksgnk lesz a Rajta prediktumra s
a Padl konstansra.
A villany felkapcsolsa: Felgyjt(s); lekapcsolsa: Leolt(s). A lmpa fel-, illetve lekapcsolshoz Shakey-nek
egy dobozon kell llnia a villanykapcsol mellett.
A 11.17. bra alapjn rja fel Shakey hat cselekvst s a kiindul llapotot STRIPS jellsekkel. Ksztsen
tervet Shakey szmra, hogy a Doboz2 dobozt a Szoba2 szobba mozgassa.
11.14.
Lttuk, hogy a tervksztsi grfok, csak tletlogikai cselekvseket kpesek kezelni. Mi van, hogyha a
tervkszt grfokat a clban vltozkat is tartalmaz problmkra kvnjuk alkalmazni, mint az Ott(P1, x)
Ott(P2, x), ahol x egy vges terlet pozciibl kerl ki? Hogyan tudna egy ilyen problmt tkdolni, hogy
tervkszt grfokkal dolgozhasson? (Segtsg: emlkezzen a rszben rendezett tervkszts Vge cselekvsre.
Ehhez milyen elfeltteleknek kellene tartozni?)
11.15.
Egszen eddig feltteleztk, hogy a cselekvsek csak a megfelel helyzetekben kerlnek vgrehajtsra. Nzzk,
hogy az tletlogikai kvet llapot aximk (mint a 11.1 egyenlet aximja) mit mondanak az olyan
cselekvsekrl, melyek elfelttelei nem teljeslnek.
a. Mutassa meg, hogy az aximk azt jsoljk, hogy semmi sem trtnik, amikor egy cselekvst olyan
llapotban hajtunk vgre, melyben az elfelttelei nem teljeslnek.
b. Vegynk egy p tervet, ami tartalmazza a cl elrshez szksges cselekvseket s illeglis cselekvseket is.
Igaz, hogy ebben az esetben
kiindul llapot kvet llapot aximk p cl
c. Egy szitucikalkulusban elsrend kvet llapot aximk esetn (mint a 10. fejezetben) lehetsges
bizonytani, hogy egy illeglis cselekvseket tartalmaz terv elrje a clt?
11.16.
A repltr problmakrbl adott pldkkal magyarzza meg, hogy a szimblumsztvlaszts hogyan cskkenti
az elfelttel s a cselekvskizrsi aximk mrett. Szrmaztasson egy ltalnos kpletet, mely az
aximahalmazok mrett adja meg az idlpsek szma, a cselekvssmk szma, ezek aritsa, valamint a
trgyak szma fggvnyben.
11.17.
A 11.15. brn szerepl SATPLAN algoritmusban a minden kielgthetsgi algoritmus hvs egy tovbbi gT clt
eredmnyez, ahol a T rtkkszlete 0 Tmax. Tegyk fel, hogy ehelyett a kielgthetsgi algoritmust csak
egyszer hvjuk meg a g0 g1 ... gTmax cllal.
a. Ez mindig ad vissza tervet, amennyiben ltezik egy Tmax hosszsg vagy annl rvidebb terv?
b. Eredmnyez ez a mdszer j hibs megoldsokat?
c. Vizsgljuk meg, hogy hogyan lehetne mdostani egy kielgthetsgi algorimust, pldul a WALKSAT
algoritmust, hogy az (amennyiben ltezik) rvid megoldsokat talljon, amennyiben hasonl diszjunktv clt
kap.
368
Created by XMLmind XSL-FO Converter.
369
Created by XMLmind XSL-FO Converter.
A 12.1. brn lthat problma brmely eddig ltott tervksztvel megoldhat. A 12.2. bra (ha a szmokkal
nem trdnk) a rszben rendezett tervkszt megoldst mutatja. Hogy az inkbb egy temezsi, mintsem egy
tervksztsi feladat legyen, minden cselekvshez meg kell hatroznunk, hogy mikor kezddjn s mikor
vgzdjn. Ez azt jelenti, hogy figyelnnk kell minden cselekvs hosszra, csakgy, mint a sorrendjre. Az
Idtartam(d) jells egy cselekvs kapcsn (ahol d csak egy szmmal helyettesthet be) azt jelenti, hogy egy
cselekvs elvgzshez d percre van szksg.
Ha adott a cselekvsek egy rszleges rendezse az idtartamokkal, ahogy a 12.2. bra is mutatja, akkor a
kritikus tvonal mdszer (critical path method CPM) felhasznlhat az egyes cselekvsek lehetsges
kezdsi s befejezsi idpontjainak meghatrozsra. Egy rszben rendezett tervben tallhat tvonal,
cselekvsek egy linerisan rendezett sorozata, ami az Indt-bl indul s a Befejez-ben fejezdik be (pldul a
12.2. bra rszben rendezett tervben kt t tallhat).
A kritikus tvonal (critical path) az az t, amelynek a teljes ideje a leghosszabb; az tvonal kritikus, mert
meghatrozza a teljes terv hosszt. Ms utak rvidtse nem rvidti a terv egszt, de a kritikus tvonalon lv
brmely cselekvs kezdetnek elhalasztsa a teljes tervet lasstja. Az brn a kritikus tvonal vonalt vastag
vonallal jelljk. Hogy a teljes tervet minimlis id alatt hajtsuk vgre, a kritikus tvonal cselekvseit gy kell
vgrehajtani, hogy kztk ne legyen ksleltets. A kritikus tvonalon kvl es cselekvseknek van valamennyi
mozgsterk egy idablak, amelyben vgrehajthatk. Ezt az idablakot a kezdeti idpont lehet legkorbbi
(ES) s a lehet legksbbi (LS) rtkvel definiljuk. Az LS ES mrszmot, a cselekvs mozgsternek
(slack) nevezzk. A 12.2. brn lthatjuk, hogy a teljes terv 85 percet vesz ignybe, a kritikus tvonal minden
cselekvsnek a mozgstere 0 (ez mindig igaz), s a C1 sszeszerelsnek minden cselekvse egy 15 perces
ablakban indthat. A cselekvsek ES s LS idi a problma temtervt (schedule) adjk.
12.2. bra - A 12.1. brn szerepl temezsi problma megoldsa. Az bra tetejn a
rszben rendezett terv megoldsa lthat. Minden cselekvs hozza a tglalap aljn
lthat, a legkorbbi s a legksbbi kezdsi idkkel [ES, LS] a bal fels sarokban. A
kt szm kztt klnbsg a cselekvs mozgstere, a 0 mozgster cselekvsek a
kritikus tvonalon vannak, melyeket vastag vonallal jellnk. Az bra aljn ugyanezen
megolds idrendjt lthatjuk. A szrke tglalapok azt az intervallumot jellik, ami
alatt a cselekvs vgrehajthat, felttelezve, hogy a sorrendezsi megktseket
betartjuk. A szrke tglalapok nem felhasznlt, nem kitlttt terletei a mozgsteret
jellik.
370
Created by XMLmind XSL-FO Converter.
ES(A) + Idtartam(A)
LS(Befejez) = ES(Befejez)
LS(A) = minA
LS(B) Idtartam(A)
Az tlet az, hogy az ES(Indt) rtknek 0-ra lltsval indtunk. Ezutn, amint elrnk egy olyan B cselekvst,
hogy minden cselekvs, ami kzvetlenl B eltt jn, mr rendelkezik ES rtkekkel, az ES(B) rtket a
kzvetlenl megelz cselekvsek kzl a legkorbbi befejezsi id maximumra lltjuk be, ahol a legkorbbi
befejezsi idt gy definiljuk, mint a cselekvs kezdsi idpontja plusz a cselekvs idtartama. A folyamat
addig folytatdik, amg minden cselekvshez egy ES rtket rendelnk. Az LS rtkeket hasonlkppen
szmtjuk ki a Befejez cselekvstl visszafel haladva. A rszleteket egy ksbbi feladat tartalmazza.
A kritikus tvonal algoritmus komplexitsa csak O(Nb), ahol N a cselekvsek szma s b az egy cselekvsbe be, illetve kimen maximlis elgazsok szma. (Ennek megrtshez vegyk szre, hogy az LS s ES
szmtsokat minden cselekvsre csak egyszer hajtjuk vgre, s minden szmts legfeljebb b msik cselekvsen
megy vgig.) Ezrt, ha adott a cselekvsek egy rszben rendezse, a minimlis idtartam temezs megtallsa
elg knnyedn elvgezhet.
371
Created by XMLmind XSL-FO Converter.
372
Created by XMLmind XSL-FO Converter.
Ez nhny nem vrt terv ellltst is megakadlyozhatja. Pldul egy csdeljrs eltt ll szemly minden ing vagyont eltntetheti (a
Pnz elrsvel) egy hz megvsrlsval vagy megptsvel. Ez a terv hasznos, mert az aktulis trvny kizrja az elsdleges lakhely
hitelezk ltali lefoglalst (legalbbis az USA-ban a szerk.).
2
374
Created by XMLmind XSL-FO Converter.
A dekompozcinak a cselekvs egy korrekt megvalstsnak kell lennie. A d terv egy a cselekvst korrekten
valst meg, ha d egy teljes s konzisztens rszben rendezett terv arra a problmra, ahol a elfeltteleibl a
kvetkezmnyeit kell elrnnk. Ha a dekompozci egy helyesen mkd rszben rendezett tervkszt
futsnak eredmnye, akkor nyilvnvalan korrekt.
Brmely magas szint cselekvshez a tervknyvtr szmos dekompozcit tartalmazhat, pldul a Hzatptnek lehet egy msik dekompozcija, amely a folyamatot gy rja le, hogy a hzat az gens sajt kezleg pti
kvekbl s malterbl. Minden dekompozcinak egy korrekt tervnek kell lennie, de a magas szint
cselekvslersban szereplkn tl tovbbi elfeltteleket s kvetkezmnyeket is tartalmazhat. Pldul a
Hzatpt 12.5. brn lthat dekompozcija a Telek mellett a Pnz-t is megkveteli, s kvetkezmnye a
Pnz. Msrszrl a sajt kez pts nem ignyel pnzt, de szksges hozz egy felhasznlsra vr K s
Malter kszlet, valamint eredmnye lehet egy FjsHt.
Mivel egy magas szint cselekvsnek, mint amilyen a Hzatpt, szmos lehetsges dekompozcija lehet,
elkerlhetetlen, hogy a STRIPS cselekvslersa elrejtse ezen dekompozcik nhny elfelttelt vagy
kvetkezmnyt. A magas szint cselekvs elfeltteleit a dekompozciiban szerepl kls elfelttelek
metszete, mg a kvetkezmnyit a dekompozcik kls kvetkezmnyeinek metszete adja. Mskppen, a magas
szint elfelttelek s kvetkezmnyek garantltan rszhalmazai minden egyszer implementci vals
elfeltteleinek s kvetkezmnyeinek.
375
Created by XMLmind XSL-FO Converter.
12.7. bra - Egy magas szint cselekvs dekompozcija egy ltez tervben. A Hzatpt
cselekvst a 12.5. bra dekompozcijval helyettestjk. A Telek kls elfelttelt a mr
ltez TelketVesz-bl kiindul okozati kapcsolat biztostja. A Pnz kls elfelttel
nyitott marad a dekompozcis lps utn, ezrt a KlcsntVeszFel cselekvst szrjuk
be.
Az ptkezs neglja az Engedly-t, egybknt ugyanazon engedly tbb hz megptshez is hasznlhat lenne. Sajnos az ptkezs nem
zrja le a Szerzds-t, mert elbb a KiviteleztKifizet-et kell vgrehajtanunk.
3
376
Created by XMLmind XSL-FO Converter.
2. A kvetkez lps, hogy az eredeti tervben szerepl a sorrendezsi megktseit megfelelen tvezessk a d
lpseihez. Elszr vegyk T B a alak sorrendezsi megktseit. Hogyan kellene B-t rendezni a d
lpseinek megfelelen? A legkzenfekvbb megolds, hogy B az sszes d-ben szerepl lps eltt jjjn,
amit gy rhetnk el, hogy d minden Indt s alak megktst a B s megktssel helyettestjk.
Msrszrl ez a megkzelts tlzottan szigor lehet! Pldul a TelketVesz a Hzatpt eltt kell
kvetkezzen, de nincsen szksg arra, hogy a TelketVesz a KiviteleztVeszFel eltt jjjn a kiterjesztett
tervben. Egy tlzottan szigor rendezs fellltsa lehetetlenn teheti nhny megolds megtallst. Ezrt
minden rendezsi megktsre a legjobb megolds, hogy rgztsk a megkts okt. Ha ezutn egy magas
szint cselekvst kibontunk, az j rendezsi megktsek a lehet leglazbbra vehetk az eredeti megkts
okval sszhangban. Ugyanezek a megfontolsok alkalmazhatk, amikor az a C alak megktseket
helyettestjk.
3. Az utols lps, hogy az okozati kapcsolatokat tvezessk. Ha a
az eredeti terv egy okozati
kapcsolata volt, helyettestsk azt egy okozati kapcsolathalmazzal, amely B-bl d sszes olyan lpshez
vezet, amelynek elfelttele a d dekompozci Indt lpse ltal ellltott p (pldul d sszes lpse,
melyekre p egy kls elfelttel). A pldban a
okozati kapcsolatot a
kapcsolatot a
kapcsolattal helyettestjk.
Ez lezrja a rszben rendezett tervksztknl alkalmazott, a dekompozcik elksztshez szksges
kiterjesztseket.4
A rszben rendezett tervkszt algoritmushoz tovbbi mdostsok szksgesek, mert a magas szint
cselekvsek elrejtik az informcit a vgs elemi megvalstsukrl. Nevezetesen az eredeti rszben rendezett
tervkszt algoritmus hibval lp vissza, ha az aktulis terv feloldhatatlan tkzst tartalmaz, vagyis ha egy
cselekvs tkzik egy okozati kapcsolattal, de nem helyezhet sem el, sem pedig mg. (Erre a 11.9. bra
mutat pldt.) Msrszrl, a magas szint cselekvsek esetn a feloldhatatlan tkzsek nha feloldhatk az
tkz cselekvsek dekompozcijval s lpseik sszerendezsvel. Erre a 12.8. bra mutat be egy pldt. gy
elfordulhat olyan eset, ahol dekompozcival egy teljes s konzisztens alapterv nyerhet, mg akkor is, hogyha
nem ltezik teljes s konzisztensen magas szint terv. Ez a lehetsg azt jelenti, hogy egy teljes HFHtervksztnek vgig kell tekintenie az eredeti rszben rendezett tervkszthz tallhat szmos metszsi
lehetsget. Egybknt hasznlhatjuk brmely metszsi eljrst, remlve, hogy nem hagyunk figyelmen kvl
lehetsges megoldst.
Vannak tovbbi apr mdostsok a magas szint cselekvsek konfliktusfeloldsnak kezelsre. Az rdekld olvas ezeknek a fejezet
vgn hivatkozott irodalmakban nzhet utna.
4
377
Created by XMLmind XSL-FO Converter.
2.3. Elemzs
Kezdjk a rossz hrrel: a tiszta HFH-tervkszts (ahol az egyetlen megengedett tervfinomts a dekompozci),
a vges llapottr ellenre is, eldnthetetlen! Ez nagyon elszomortnak tnhet, mivel a HFH-tervkszts
lnyege, hogy nveljk a hatkonysgot. Ez a nehzsg azrt lp fel, mert a cselekvsdekompozcik
rekurzvak (recursive) (pldul a stls implementlhat egy lps megttelvel s utna egy stlssal), gy a
HFH-tervek tetszlegesen hosszra nylhatnak. Nevezetesen a legrvidebb HFH-megolds is tetszlegesen
hossz lehet, gy nincs arra lehetsg, hogy a keresst egy megadott id utn lelltsuk. Ennek ellenre azonban
legalbb hrom okunk van a bizakodsra:
1. Kizrhatjuk a rekurzit, amit csak nagyon kevs tervksztsi feladat ignyel meg. Ebben az esetben az
sszes HFH-terv vges vagy megszmllhat hosszsg.
378
Created by XMLmind XSL-FO Converter.
Egy rszfeladat-megosztst tartalmaz HFH-tervkszt sokkal hatkonyabb megoldsokat kszthet, mert a sin
kiszmtsnak szmos lpsre vlaszthatja a tan meglv lpseit. A legtbb fordt nem alkalmazza ezt a
fajta procedrk kztti megosztst, mert az sszes lehetsges megosztott terv figyelembevtele tl sok idt
venne ignybe. Ehelyett a legtbb fordt minden rsztervet fggetlenl kszt el, majd esetleg mdostja az
eredmnyt egy optimalizl hasznlatval.
A cselekvsdekompozci ltal bevezetett jrulkos bonyoltsok tudatban mirt hisszk mgis, hogy a HFHtervkszts hatkony lehet? A komplexits vals forrsai a gyakorlatban nehezen analizlhatk, ezrt vegynk
egy idealizlt esetet. Tegyk fel pldul, hogy egy n cselekvsbl ll tervet akarunk ltrehozni. Egy
nemhierarchikus elrefel halad llapottr-tervez kltsge, minden llapotban b megengedett cselekvssel,
O(bn). A HFH-tervkszt esetn felttelezznk egy nagyon ltalnos dekompozcis formt: minden nem elemi
cselekvsnek, d lehetsges dekompozcija van, mindegyik a kvetkez alacsonyabb szinten k cselekvsbl ll.
Tudni szeretnnk, hogy ebben a struktrban hny klnbz dekompozcis fa ltezik. Ha a kiindulsi szinten
n cselekvs van, akkor a gykr alatti szintek szma logkn, gy a bels dekompozcis csompontok szma 1 + k
+ k2 + klog k n1 = (n 1)/(k 1). Minden bels csompontnak d lehetsges dekompozcija van, gy sszesen
d(n1)/(k1) lehetsges dekompozcis fa alkothat. Ezt a kpletet megvizsglva lthatjuk, hogy d alacsonyan tartsa
nagy k mellett risi megtakartsokat eredmnyezhet. Ha b s d sszemrhet, akkor gyakorlatilag a
nemhierarchikus kltsg k-adik gykt vesszk. Msrszrl azonban egy kisszm, de hossz dekompozcit
tartalmaz tervknyvtr megalkotsa, br lehetv teszi brmely problma megoldst, nem mindig lehetsges.
Mskpp mondva, a hossz makrk, amelyek problmk szles krn alkalmazhatk, kiemelten rtkesek.
379
Created by XMLmind XSL-FO Converter.
381
Created by XMLmind XSL-FO Converter.
4. Feltteles tervkszts
Feltteles tervkszts a bizonytalansg kezelsnek egy mdja. Mdszere, hogy a terv elre meghatrozott
pontjain ellenrzi, hogy valjban mi is trtnik a krnyezetben. A feltteles tervkszts bemutatsa a teljesen
megfigyelhet krnyezetek esetn a legegyszerbb, gy ezzel az esettel kezdnk. A rszlegesen megfigyelhet
eset jval nehezebb, de egyben jval rdekesebb is.
Szintn hasznosnak talljuk a feltteles kvetkezmnyeket (conditional effects), amikor is egy cselekmny
kvetkezmnye fgg attl az llapottl, amelyben vgrehajtjuk. A feltteles kvetkezmnyek a cselekvs
KVETKEZMNY rszben jelennek meg a when <felttel>: <kvetkezmny> szintaxissal. Pldul a Szv
cselekvs modellezsre a
Cselekvs(Szv, Elfelttel:, Kvetkezmny:(when OttBal: TisztaBal)
(when OttJobb: TisztaJobb))]
Nyilvnvalan az OttJobb akkor s csak akkor igaz, ha a OttBal igaz, s fordtva. A kt llts hasznlatnak oka fknt az olvashatsg
javtsa.
5
382
Created by XMLmind XSL-FO Converter.
lerssal modellezhet, ami mind diszjunktv, mind pedig feltteles. 6 Hogy feltteles terveket kszthessnk,
feltteles lpsekre (conditional steps) van szksgnk. Ezeket az if <teszt> then terv_A else terv_B
szintaxis hasznlatval rjuk le, ahol a <teszt> egy ktrtk fggvnye az llapotvltozknak. Az if OttBal
TisztaBal then Jobbra else Szv pldul a porszvvilg egy feltteles lpse lehet. Egy ilyen lps vgrehajtsa
a kzenfekv mdon trtnik. A feltteles lpsek egymsba gyazsaival a tervek fk lesznek.
A feltteles tervektl elvrjuk, hogy mkdjenek, fggetlenl attl, hogy valjban a cselekvs mely kimenetele
kvetkezik be. Ezzel a problmval egy msik kntsbe bjtatva mr tallkoztunk korbban. A ktszemlyes
jtkokban (lsd 6. fejezet) olyan lpseket szeretnnk, amelyek az ellenfl lpseitl fggetlenl gyzelemhez
vezetnek. A nemdeterminisztikus tervksztsi problmkat ezrt gyakran termszet elleni jtkoknak (games
against nature) nevezik.
Vegyk a porszvvilg egy specilis pldjt. A kiindul llapotban a robot a tiszta vilg jobb oldali ngyzetn
van. Mivel a krnyezet teljesen megfigyelhet, az gens ismeri a teljes OttJobb TisztaBal TisztaJobb
llapotlerst. A clllapotban a robot a tiszta vilg bal oldali ngyzetn van. Ez a feladat elg trivilis lenne, ha
nem a dupla-Murphy porszvval lenne dolgunk, amely nha piszkot hagy maga utn, amikor egy tiszta
clngyzetre lp, s nha bepiszkolja a tiszta ngyzetet, ha a Szvs cselekvs vgrehajtdik.
Ennek a krnyezetnek a jtkfjt a 12.9. brn mutatjuk be. A cselekvseket a robot a fa llapot
csompontjaiban hajtja vgre, majd a krrel jellt valsznsgi csompontokban a termszet dnt a
cselekvs kimenetelrl. A megolds egy rszfa, mely (1) minden levelben egy cl csompontot tartalmaz, (2)
minden llapot csomponthoz egy cselekvst specifikl, s (3) minden valsznsgi csompontban
tartalmazza az sszes kimenetelhez tartoz gat. Az brn a megoldst vastag vonallal jelltk, ami a [Balra, if
OttBal TisztaBal TisztaJobb then [] else Szv] tervnek felel meg. (Mivel llapottr-tervksztt hasznlunk,
a feltteles lpsekben hasznlt tesztek egyelre teljes llapot lersok.)
A when TisztaBal: TisztaBal feltteles kvetkezmny egy kicsit furcsnak tnhet. Emlkezznk vissza azonban, hogy itt a TisztaBal a
cselekvs eltti, mg a TisztaBal a cselekvs vgrehajtsa utni helyzetre vonatkozik.
6
383
Created by XMLmind XSL-FO Converter.
A jtkok pontos megoldshoz a minimax algoritmust hasznljuk (lsd 6.3. bra). Ehhez a feltteles
tervksztsben tipikusan kt mdosts tartozik. Elszr is, a MAX s a MIN csompontok VAGY s S
csompontokk vlhatnak. Nyilvnvalan a tervnek minden elrt llapotban vlasztania kell valamilyen
cselekvst, de kezelnie kell ezen cselekvs minden kimenetelt. Msodszor, az algoritmusnak nemcsak egy
lpst kell megadnia, hanem egy feltteles tervet kell ksztenie. Egy VAGY csompontban a terv egyszeren a
vlasztott cselekvs, amelyet brmi kvethet. Egy S csompontban a terv if-then-else lpsek egymsba
gyazott sorozata, melyek minden lehetsges kimenetelhez egy rsztervet adnak meg. Ezen lpsekben a felttel
vizsglatokban teljes llapotlersok szerepelnek.7
384
Created by XMLmind XSL-FO Converter.
Formlisan az eddig definilt keressi tr egy s-vagy grf. Az S-VAGY grfok korbban a 7. fejezetben az
tletlogikai Horn-klz kvetkeztetsben jelentek meg. Itt az gak logikai kvetkeztet lpsek helyett
cselekvsek, de az algoritmus azonos. A 12.10. bra az S-VAGY grfok keressre egy rekurzv, mlysgi
keres algoritmust ad meg.
A bemutatott algoritmusban kulcsfontossg a nemdeterminisztikus tervksztsi problmkban gyakran
felmerl ciklusok kezelsnek mdja (pldul ha egy cselekvsnek nha nincs kvetkezmnye vagy egy
helytelen kvetkezmny kijavthat). Ha az aktulis llapot azonos a gykrtl idig vezet tvonal egy
llapotval, akkor hibval tr vissza. Ez nem jelenti, hogy nincs megolds az aktulis llapotbl, egyszeren
annyit jelent, hogy van egy nemciklikus megolds, ami elrhet az aktulis llapot korbbi elfordulsbl, gy
az llapot jabb bekvetkezse kihagyhat. Ezzel az ellenrzssel biztostjuk, hogy az algoritmus minden vges
llapottr esetn lelljon, mivel minden tvonal clt r, zskutcba jut, vagy egy llapot ismtlse. Vegyk
szre, hogy az algoritmus nem ellenrzi, hogy az aktulis llapot egy msik tvonalon szerepl llapot
ismtlse-e. A 12.15. feladat ezt a krdst jrja krl.
385
Created by XMLmind XSL-FO Converter.
alak. (A while OttJobb do Balra kifejezs egy jobb szintaxis a terv ciklikus rszre.) Az S-VAGY-GRFKERESS-ben szksges mdostsokat a 12.16. feladat dolgozza fel. A megvalsts kulcsa, hogy az
llapottrben egy L llapotba visszalp hurok a tervben egy arra a pontra visszamutat hurkot jelent, ahol az L
llapotba vezet rsztervet vgrehajtjuk.
gy mr kpesek vagyunk feltteleket s ciklusokat tartalmaz programokhoz hasonlatos sszetett tervek
ltrehozsra. Sajnos ezek a ciklusok vgtelen ciklusok lehetnek. Pldul a tripla-Murphy vilg cselekvs
reprezentcijban a semmi jelentse, hogy a Balra szksgszeren sikeres. A ciklikus tervek ezrt kevsb
elnysek, mint a ciklus nlkliek, de megoldsnak tekinthetk, amennyiben minden levl egy clllapot, s a
terv minden pontjbl elrhet egy levl.
Ezeket a fogalmakat a 3.6. alfejezetben vezettk be, gy az olvas ezt tismtelheti a tovbblps eltt.
A kisgyermekes szlk jl ismerhetik ezt a jelensget. Tisztelet a kivtelnek.
10
Vegyk szre, hogy ezek nem aszerint kerlnek osztlyzsra, hogy az gens piszkot hagy-e maga utn, amikor mozdul. A hiedelmi
llapottrbeli elgazsokat a klnbz tudslehetsgek, s nem a klnbz fizikai kimenetelek okozzk.
8
9
386
Created by XMLmind XSL-FO Converter.
Ezzel kszen vagyunk? Nem egszen! Mg meg kell hatroznunk, hogy hogyan reprezentljuk a hiedelmi
llapotokat, hogyan mkdik az rzkels, s hogy ebben az j helyzetben hogyan rjuk le a cselekvseket.
A hiedelmi llapotok esetn alapveten hrom vlasztsunk van:
1. Teljes llapotlersok halmazai. Pldul a 12.12. bra kiindul hiedelmi llapota az
{(OttJobb TisztaJobb TisztaBal), (OttJobb TisztaJobb TisztaBal)}
Ezzel a lerssal knny dolgozni, de nagyon kltsges: ha n ktrtk tletllts definil egy llapotot, akkor a
hiedelmi llapot O(2n) fizikai llapotlerst tartalmazhat, melyek mindegyike O(n) mret. Ha az gens az
tletlltsoknak csak egy tredkt ismeri, exponencilisan nagy hiedelmi llapotok addnak minl
kevesebbet tud, annl tbb lehetsges llapotban lehet.
2. Logikai mondatok, melyek pontosan lerjk a hiedelmi llapotban lehetsges vilgok halmazt. Pldul a
kiindul llapot az
OttJobb TisztaJobb
387
Created by XMLmind XSL-FO Converter.
ahol K jelentse tudja s K(P) jelentse, hogy az gens tudja, hogy P igaz.12 A tuds tletlltsokkal zrt
vilg felttelezst hasznlunk, azaz ha egy llts nem jelenik meg a listban, akkor hamisnak felttelezzk.
Pldul a K(TisztaBal) s a K(TisztaBal) implicit szerepelnek a fenti mondatban, gy az rgzti a tnyt, hogy
az gens rzketlen a TisztaBal igazsgrtkre.
Kimutathat, hogy a msodik s harmadik lehetsgek durvn azonosak, de mi a harmadik tuds, az tletllts
lehetsget hasznljuk, mert ez az rzkels egy ersebb lerst adja, s mert mr tudjuk, hogy hogyan rhatunk
a zrt vilg felttelezs (closed-world assumption) mellett STRIPS kifejezseket.
Fontos
Mindkt esetben, minden tletszimblum hromflekppen jelenhet meg: lehet pozitv, neglt vagy
ismeretlen. Ezrt gy pontosan 3n lehetsges hiedelmi llapot adhat meg. A hiedelmi llapotok
halmaza gy a hatvnyhalmaza (az sszes rszhalmaz halmaza) a fizikai llapotoknak. sszesen 2n
fizikai llapot van, ezrt 2^2n hiedelmi llapot, ami sokkal tbb, mint 3n, gy a 2. s 3. vlaszts elgg
korltozottan alkalmas a hiedelmi llapotok lersra. Ez jelenleg hasznlhatatlannak tnik, hiszen
brmely sma, ami kpes minden lehetsges hiedelmi llapot reprezentlsra, O(log2(2^2n)) = O(2n)
bitet ignyel, hogy legrosszabb esetben mindegyiket lerhassa. A mi egyszer smnk csak O(n) bitet
ignyel a hiedelmi llapotok lershoz, mert a kifejezkpessget a tmrsgre cserltk.
Nevezetesen, ha egy cselekvs megjelenik, amelynek az elfelttelei ismeretlenek, akkor az
eredmnyknt kapott hiedelmi llapot nem lesz pontosan reprezentlhat, s a cselekvs kimenetele
ismeretlen lesz.
Most arrl kell dntennk, hogy az rzkels hogyan mkdik. Itt kt vlasztsunk van. Hasznlhatunk
automatikus rzkelst (automatic sensing), ami annyit tesz, hogy az gens minden idlpsben az sszes
elrhet rzetet megkapja. A 12.12. brn lthat plda a helyzet s a helyi tisztasg meghatrozsra
automatikus rzkelst felttelez. Hasznlhatunk ellenben aktv rzkelst (active sensing), ami annyit jelent,
hogy az rzkelt informcik csak megadott rzkelsi cselekvsek (sensory actions), (mint
TisztasgEllenrzs s PozciEllenrzs) vgrehajtsval nyerhetk. Az rzkelsi tpusokat sorban trgyalni
fogjuk.
Most hasznljunk tuds lltsokat a cselekvsek lershoz. Tegyk fel, hogy az automatikus helyi
tisztasgrzkelssel felruhzott vltakoz-dupla-Murphy vilg problmban az gens Balra lp. Az erre a
vilgra vonatkoz szablyoknak megfelelen az gens hagy, vagy taln nem hagy piszkot maga utn, ha a
ngyzet tiszta volt. Mint fizikai kvetkezmny, ez diszjunktv lenne, de mint tuds kvetkezmny ez egyszeren
trli az gens TisztaJobb tudst. Emellett az gens a helyi piszokrzkels miatt gy vagy gy tudni fogja, hogy
vajon a TisztaBal igaz-e, s tudni fogja, hogy a pozcija OttBal:
Cselekvs(Balra, Elfelttel:OttJobb,
Az ltalnos tletlogikai mondatok legjobb kanonikus reprezentcija a binris dntsi diagram (binary decision diagram) vagy BDD
(Bryant, 1992).
12
Ez a jells ugyanaz, mint amit a 7. fejezetben az ramkralap genseknl hasznltunk. Nhny szerz ezt a tudja, hogy P igaz-e
rtelemben hasznlja. A kt rtelmezs kztti fordts kzenfekv.
11
388
Created by XMLmind XSL-FO Converter.
Vegyk szre, hogy az elfelttelek s a when felttelek egyszer lltsok s nem tuds lltsok. Ez gy van,
ahogy lennie kell, hiszen a cselekvsek kimenetele fgg az aktulis vilgtl, de hogyan ellenrizhetnnk ezen
felttelek igazsgrtkt csupn a hiedelmi llapot alapjn? Ha az gens az aktulis hiedelmi llapotban tudja
mondjuk a K(OttJobb) lltst, akkor az lltsnak igaznak kell lennie az aktulis fizikai llapotban, gy egyben a
cselekvs is alkalmazhat. Ha az gens nem ismeri az lltst (pldul TisztaBal az if felttelt), akkor a hiedelmi
llapotnak tartalmaznia kell olyan vilgokat, melyekben a TisztaBal igaz, s olyan vilgokat, amelyekben a
TisztaBal hamis. Pontosan ez az, ami miatt egy cselekvs tbbszrs hiedelmi llapotokat eredmnyez. gy, ha a
kiindul llapot a (K(OttJobb) K(TisztaJobb)), akkor a Balra lps utn a (K(OttBal) K(TisztaBal)) s a
(K(OttBal) K(TisztaBal)) a kt lehetsges hiedelmi llapot. Mindkt esetben ismert a TisztaBal rtke, gy a
TisztaBal teszt felhasznlhat a tervben.
Aktv rzkels (mint az automatikus rzkels ellentettje) esetn, az gens csak krsre kap j megfigyelseket.
gy a Balra lps utn az gens nem tudja, hogy a bal oldali ngyzet piszkos-e, ezrt a (12.2) cselekvsler
egyenletben az utols kt feltteles kvetkezmny mr nem jelenik meg. Az gens a TisztasgEllenrzs
cselekvssel dertheti ki, hogy a ngyzet piszkos-e:
Cselekvs(TisztasgEllenrzs, Kvetkezmny: when OttBal TisztaBal: K(TisztaBal)
when OttBal TisztaBal: K(TisztaBal)
when OttBal TisztaJobb: K(TisztaJobb)
when OttBal TisztaJobb: K(TisztaJobb) (12.3)
Knny megmutatni, hogy aktv rzkels esetn a Balra lpssel kvetett TisztasgEllenrzs cselekvs
ugyanazt a kt hiedelmi llapotot eredmnyezi, amit az automatikus rzkels esetn a Balra adott. Aktv
rzkels esetn a fizikai cselekvsek egy hiedelmi llapotot mindig egyetlen kvet hiedelmi llapotra
kpeznek le. A tbbszrs hiedelmi llapotok csak az rzkel cselekvsek ltal jhetnek ltre, melyek
specifikus tudst adnak, s ezrt lehetv teszik a felttelvizsglatok hasznlatt a tervekben.
Az eddigiekben az llapottr S-VAGY keressn alapul feltteles tervksztsre mutattunk be egy ltalnos
megkzeltst. Ez a megkzelts nhny tesztproblmn elg hatkonynak bizonyult, de ms feladatokra
alkalmatlan. Bizonythat, hogy a feltteles tervkszts nagyobb algoritmikus komplexits, mint a
hagyomnyos. Emlkezznk vissza, hogy az NP osztly defincija alapjn egy megoldsrl ellenrizhet, hogy
polinomilis idej-e. Ez a hagyomnyos tervekre (legalbbis a polinomilis mretekre) igaz, gy a
hagyomnyos tervkszts az NP osztlyba tartozik. A feltteles tervkszts esetn egy jelltre ellenrizni kell,
hogy az sszes lehetsges llapotra a tervben ltezik-e valamilyen, a clt kielgt tvonal. Az
sszes/valamilyen sszellts nem ellenrizhet polinomilis idben, gy a feltteles tervkszts nehezebb,
mint NP. Ez csak gy kerlhet el, hogy a tervksztsi fzisban figyelmen kvl hagyunk nhny lehetsges
eshetsget, s ezeket csak akkor kezeljk, ha valjban fellpnek. A kvetkez alfejezetben ezt a megkzeltst
elemezzk.
389
Created by XMLmind XSL-FO Converter.
A 12.14. bra a folyamat sematikus illusztrcija. Az jratervez szreveszi, hogy a terv els cselekvsnek
elfeltteleit az aktulis llapot nem elgti ki. Ezutn meghvja a tervksztt, hogy ksztsen egy j javts-nak
nevezett rsztervet, amely az aktulis llapotbl a teljes_terv valamely s llapotba vezet vissza. Ebben a
pldban az s trtnetesen egylpsnyi visszalpst jelent az aktulis htralv terv-bl. (Ez az oka, hogy a
htralv terv helyett a teljes tervet figyeljk.) ltalnossgban s-et a jelen llapothoz a lehet legkzelebbre
vlasztjuk. Az j terv a javts s a teljes_terv s-tl htralev rsze amit folytats-nak neveznk
sszefzsbl addik, mellyel az gens kszen ll a vgrehajts folytatsra.
Trjnk vissza az asztal s a szk azonos sznre festsnek problmjhoz, ez alkalommal jratervezssel.
Felttelezzk a teljesen megfigyelhet krnyezetet. A kiindul llapotban a szk kk, az asztal zld, valamint 1
doboz kk s 1 doboz zld festk ll rendelkezsnkre. Ez a kvetkez problma defincihoz vezet:
390
Created by XMLmind XSL-FO Converter.
12.14. bra - A vgrehajts eltt a tervkszt egy teljes_terv-nek nevezett tervet kszt,
mely S-bl G-be vezet. Az gens az E-vel jellt pontig vgrehajtja a tervet. A terv
htralev rsznek vgrehajtsa eltt a szoksos mdon ellenrzi az elfeltteleket, s
azt tallja, hogy valjban az O llapotban van, s nem az E-ben. Ezutn meghvja a
tervkszt algoritmust, hogy ksztsen egy javts-t, mely egy terv az O-bl az eredeti
teljes_terv egy P pontjhoz. Az j terv ezutn a javts s a folytats (az eredeti teljes_terv
maradk rsze) sszefzsbl addik.
Kiinduls(Szne(Szk,
Szne(Asztal, Zld)
Kk)
SzntTartalmaz(BC,
FestkDoboz (BC)
Kk)
SzntTartalmaz(RC,
FestkDoboz (RC)
Piros)
Cl(Szne(Szk, x)
x))
Szne(Asztal,
Cselekvs(Fest(trgy, szn),
Elfelttel:VanFestk(szn)
Kvetkezmny:Szne(trgy, szn))
Cselekvs(Nyit(doboz),
Elfelttel:FestkDoboz(doboz)
Szne(doboz, szn)
Kvetkezmny:Szne(szn))
Az gens most kszen ll a terv vgrehajtsra. Tegyk fel, hogy minden jl megy, s az gens kinyitja a kk
festket s az asztalra keni. Az elz alfejezet gensei a terv lpsnek befejezse utn gyzelmet kiltannak.
A vgrehajts-monitoroz gensnek ellenben elszr ellenriznie kell a Befejez lps elfelttelt, ami azt
391
Created by XMLmind XSL-FO Converter.
A tervmonitorozs okosabb teszi az gensnket egy ganajtr bogrnl (lsd 2.3. szakasz - Mindentuds, tanuls s autonmia rszben).
Az gensnk szrevenn, hogy a ganaj mr nincs a lbainl, jratervezne, hogy szerezzen egy msikat, s azzal zrn le a lyukat.
13
392
Created by XMLmind XSL-FO Converter.
6. Folytonos tervkszts
Ebben az alfejezetben olyan genst terveznk, amely meghatrozatlanul sokig kitart egy krnyezetben. gy ez
nem egy problmamegold, ami egyetlen clt szeretne elrni s ezt tervezi, s addig cselekszik, amg a clt el
nem ri, hanem folyamatosan vltoz clok, tervksztsi s cselekvsi fzisok sorozatt li meg. Ahelyett hogy
a tervksztt s a cselekvsmonitorozt mint klnll, de egymsnak eredmnyeket szolgltat folyamatokat
tekintetnnk, a folytonos tervkszt gensben (continuous planning agent) ezeket egyetlen folyamatknt
kpzeljk el.
Az gensre mindig gy gondolunk, mint ami rsze egy terv vgrehajtsnak, az lete nagy tervnek. Cselekvsei
tartalmazzk a vgrehajtsra kszen ll terv lpseinek vgrehajtst, a nyitott elfelttelek kielgtsre vagy a
konfliktusok feloldsra szolgl tervfinomtst, a vgrehajts sorn nyert j informcik fnyben a terv
mdostst. Nyilvnval, hogy amikor elszr j clt forml, az gensnek nincsenek vgrehajtsra ksz
cselekvsei, ezrt egy kis idt a rszleges terv elksztsvel tlt. Nagyon is lehetsges azonban, hogy az gens a
terv teljes befejezse eltt elkezdi a vgrehajtst, klnsen ha fggetlen rszclokat kell elrni. A folytonos
tervkszt gens folyamatosan monitorozza a vilgot, az j megfigyelsek alapjn mdostja ennek modelljt,
mg akkor is, ha elkpzelsei mg mindig vltoznak.
Elszr egy pldn haladunk vgig, majd bemutatjuk az gens programjt, amelyet FOLYTONOS-RRT-GENS-nek
neveznk, mivel a tervezett cselekvsek reprezentlsra rszben rendezett terveket hasznl. Hogy a lerst
egyszerstsk, teljesen megfigyelhet krnyezetet feltteleznk. Ugyanezen technikk kiterjeszthetk a rszben
megfigyelhet esetre is.
A pldnk a kockavilg problmakrbl szrmazik (lsd 11.1. alfejezet). A kiindul llapot a 12.15. (a) brn
lthat. A Mozgat(x, y) cselekvsre van szksgnk, ami az x kockt az y kockra mozgatja, amennyiben
mindketten szabadok. A cselekvs smja:
Cselekvs(Mozgat(x, y),
Elfelttel:Tiszta(x) Tiszta(y) Rajta(x, z)
Kvetkezmny:Rajta(x, y) Tiszta(z) Rajta(x, z) Tiszta(y)
Az gensnek elszr egy clt kell megfogalmaznia. Itt nem trgyaljuk a clkialaktst, helyette felttelezzk,
hogy az gensnek valahogy megmondtk (vagy sajt maga eldnttte), hogy a Rajta(C, D) Rajta(D, B) clt
kell elrnie. Az gens ehhez a clhoz kezdi a tervezst. Ellenttben minden msik gensnkkel, amelyek
lekapcsoljk rzkeliket, amg a tervkszt egy teljes megoldst nem ad a problmra, a folytonos tervkszt
gens inkrementlisan pt egy tervet, ahol a terv minden bvtse egy korltos idtartamot vehet ignybe.
Minden bvts utn az gens egy NoOp cselekvst ad vissza, s ellenrzi az rzkelseit. Felttelezzk, hogy az
rzkelt adatok nem vltoznak, s az gens gyorsan megalkotja a 12.16. brn lthat tervet. Vegyk szre,
hogy br mindkt cselekvs elfeltteleit teljesti az Indt llapot, van egy kvetsi megkts, ami a Mozgat(D,
A tervjavts hatstalan ismtlse pontosan megfelel a szcskel darzs viselkedsnek (lsd 2.3. szakasz - Mindentuds, tanuls s
autonmia rszben).
14
393
Created by XMLmind XSL-FO Converter.
12.15. bra - Az llapotok sora, amint a folytonos tervkszt gens megprblja a (d)nek megfelel Rajta(C, D) Rajta(D, B) clllapotot elrni. A kiindul llapot az (a). A
(b) llapotnl egy msik gens kzbelpett s (d)-t (b)-re helyezte. A (c) llapotban az
gens a Mozgat(C, D) cselekvst hajtotta vgre, ami sikertelen volt, (c)-t az (a)-ra ejtette.
jraprblja a Mozgat(C, D) cselekvst, amivel elri a (d) clllapotot.
12.16. bra - A folytonos tervkszt gens ltal ksztett kiindul terv. A terv egyelre
nem klnbzik egy tlagos rszben rendezett tervkszt ltal ksztettl.
Miutn a rgi Mozgat(D, B) s Befejez kztti okozati kapcsolatot eltvoltottuk, a Mozgat(D, B) tovbbiakban
nem forrsa egyetlen okozati kapcsolatnak sem. Ez most egy redundns lps (redundant step). Minden
redundns lpst s brmely ezt biztost kapcsolatot kitrlnk a tervbl. Ez a 12.18. brn lthat tervet
eredmnyezi.
394
Created by XMLmind XSL-FO Converter.
Ebbl a pldbl lthat, hogy a folytonos tervkszts nagyban hasonlt a rszben rendezett tervksztshez.
Minden iterciban az algoritmus tall valami tervsrlsnek (plan flaw) nevezett javtanivalt a tervben, s
megjavtja. A rszben rendezett tervkszt algoritmus egy srlseltvolt algoritmusnak tekinthet, ahol a
395
Created by XMLmind XSL-FO Converter.
7. Multigens tervkszts
Eddig egygenses krnyezetekkel (single-agent enviroments) foglalkoztunk, amelyben az gensnk egyedl
van. Amikor ms gensek is jelen vannak a krnyezetben, az gensnk egyszeren hozzveheti ket a
krnyezetrl alkotott modelljhez, az alapvet algoritmusainak mdostsa nlkl. Sok esetben azonban ez
gyenge teljestmnyhez vezetne, mert tbbi genssel val foglalkozs nem azonos a krnyezet kezelsvel.
396
Created by XMLmind XSL-FO Converter.
12.23. bra - A pros tenisz problma. Kt gens egytt jtszik, s ngy pozci
egyikben lehetnek: [Bal, Alapvonal], [Jobb, Alapvonal], [Bal, Hl] s [Jobb, Hl]. A
labda visszaadhat, ha pontosan egy jtkos van a megfelel helyen.
Ez a jellsrendszer kt jdonsgot vezet be. Elszr az gens(A, B) deklarlja, hogy kt gensnk van, A s B,
akik a tervben szerepelnek. (Ebben a problmban a szemben ll jtkosokat nem gensnek vesszk.)
Msodszor minden cselekvs az genst explicit mdon, mint egy paramtert emlti, mert pontosan kvetnnk
kell, melyik gens mit csinl.
A multigens tervksztsi problma megoldsa egy egyttes terv (joint plan), amely minden genshez
tartalmaz cselekvseket. Az egyttes terv egy megolds, ha a clt elrjk azltal, hogy mindegyik gens
vgrehajtja a szmra kijellt cselekvseket. A kvetkez terv a tenisz problma egy megoldsa :
Terv1:
A: [Megy(A, [Jobb, Alapvonal]), t(A, Labda)]
B: [NoOp(B), NoOp(B)]
Ha mindkt gens ugyanazzal a tudsbzissal rendelkezne, s ez lenne az egyetlen megolds, akkor minden
rendben lenne; minden gens meghatrozn a megoldst, s egyttesen vgrehajtank. Az gensek szmra
sajnlatos (s hamarosan ltni fogjuk, hogy ez mirt sajnlatos), hogy van egy msik terv is, ami az elshz
hasonlan kielgti a clt:
Terv 2:
15
Nem biztos, hogy az Egyeslt Kirlysg laki, ahol egy pikniknek mr pusztn a tervezse is est garantl, egyetrtenek ezzel.
397
Created by XMLmind XSL-FO Converter.
Ha az A a 2. tervet vlasztja, s B az 1-et, akkor senki sem fogja visszaadni a labdt. Fordtva, ha A az 1-et s B
a 2-t vlasztja, akkor vrhatan sszetkznek egymssal, senki nem adja vissza a labdt, s a hl is
fedezetlenl marad. Ezrt a helyes egyttes terv ltezse nem jelenti, hogy a clt el is rjk. Az genseknek
szksgk van egy koordincis (coordination) mechanizmusra, hogy ugyanazt az egyttes tervet rjk el, st
mi tbb, az gensek kzs tudssal is kell rendelkezzenek (lsd 10. fejezet) arrl, hogy melyik egyttes tervet
hajtjk vgre.
Itt egy tilt egyidejsgi megktsnk van, azaz az t cselekvs vgrehajtsa alatt egy msik gens nem hajthat
vgre egy msik t cselekvst. Hasonlkppen megkvetelhetnk egyidej cselekvst. Pldul amikor kt
gensre van szksg egy dtkkel teli httska teniszplyhoz cipelshez. Ezen cselekvs lersa azt fejezi
ki, hogy az A gens nem hajthatja vgre a Cipel cselekvst, hacsak nincs egy msik B gens, aki egyidejleg egy
Cipel cselekvst hajt vgre ugyanazon httskval:
398
Created by XMLmind XSL-FO Converter.
Ezen reprezentci segtsgvel a rszben rendezett tervkszthz nagyon kzeli tervkszt hozhat ltre.
Mindssze hrom klnbsg van:
1. Az A B temporlis rendezsi relcit kiegsztend megengedjk az A = B-t s az
egyidejsget, illetve megelzsget vagy egyidejsget jelent.
-t, ami
2. Amikor egy j cselekvs egyidej cselekvseket ignyel, pldnyostani kell ezen cselekvseket a terv j
vagy ltez cselekvseinek felhasznlsval.
3. A tiltottan egyidej cselekvsek a megktsek jabb forrsai. Minden megktst fel kell oldani az tkz
cselekvsek egyms el vagy mg rendelsvel.
Ez a reprezentci a tbbtrzs problmakrkhz alkalmazott, rszben rendezett tervksztvel ekvivalens.
Kiterjeszthetnnk ezt a megkzeltst az utols kt fejezet finomtsaival HFH-ek rszleges megfigyelhetsg,
felttelek, vgrehajts-monitorozs s jratervezs , de ez tlmutat a knyv clkitzsein.
399
Created by XMLmind XSL-FO Converter.
Ha minden madr azonos szablyrendszert hajt vgre, a csapat replse egy kialakul viselkedst (emergent
behavior) mutat, hasonlan egy nagyjbl azonos srsg pszeudomerev test viselkedshez, amely nem
bomlik fel az id sorn. Mint a bogaraknl, itt sincs szksg arra, hogy minden gens ismerje a teljes sszetett
tervet, ami a tbbi gens cselekvst modellezi.
A konvencik ahelyett, hogy minden egyes j problmhoz kifejlesztennk ket, tipikusan egyedi multigens
tervkszt problmk egy egsz csoportjhoz kszlnek. Ez rugalmatlansghoz s hibhoz vezethet, amit nha
lthatunk, ha a pros tenisz jtszmban a labda nagyjbl azonos tvolsgra van a kt partner kztt. Egy
alkalmazhat konvenci hinyban az gensek kommuniklhatnak (communication), hogy egy kzs tudst
rjenek el az alkalmazhat sszetett tervbl. Pldul a teniszpros egy jtkosa felkilthat Enym! vagy
Tid!, hogy jelezze a preferlt tervet. A kommunikcis mechanizmusokat nagyobb mlysgben a 22.
fejezetben trgyaljuk, ahol megfigyelhetjk, hogy a kommunikci nem szksgszeren szbeli
informcicsert jelent. Pldul egy jtkos gy is kzlheti az ltala elnyben rszestett sszetett tervt a
msikkal, hogy vgrehajtja annak kezd rszlett. A teniszjtszma problmnkban, ha az A gens elindul a
hlhoz, akkor a B gens rknyszerl, hogy visszamenjen az alapvonalhoz megtni a labdt, mivel a msodik
terv az egyetlen sszetett terv, ami A hlhoz mozgsval kezddik. Ez az irnytsi megkzelts, amelyet
gyakran a terv felismersnek (plan recognition) neveznk, akkor mkdik, ha egyetlen cselekvs (vagy
cselekvsek rvid sorozata) elegend, hogy egyrtelmen azonostsuk az sszetett tervet.
Azt a terhet, amely biztostja, hogy az gensek egy sikeres sszetett tervhez jussanak, vagy az gensek
ksztire, vagy magukra az gensekre helyezhetjk. Az els esetben mieltt az gensek tervezni kezdennek, az
gens ksztjnek bizonytania kell, hogy az gensek szablyai s stratgii sikeresek lesznek. Az gensek
nmagukban lehetnek reaktvak, amennyiben ez mkdik az ket krlvev krnyezetben, valamint ha nem
kell, hogy pontos modelljk legyen a tbbi gensrl. Az utbbi esetben az gensek megfontoltak: bizonytaniuk
vagy demonstrlniuk kell, hogy a tervk hatkony lesz, figyelembe vve a tbbi gens megfontolsait. Pldul
egy A s B logikai genst tartalmaz krnyezetben mindketten rendelkezhetnek a kvetkez defincival:
p, s Megfelel(p, s) KzsTuds({A, B}, Elri(p, s, Cl))
Ez azt mondja, hogy brmely s szituciban, a p terv egy alkalmazhat sszetett terv, ha az gensek kzsen
tudjk, hogy a p elri a clt. Tovbbi aximkra van szksgnk, hogy biztostsuk egy adott sszetett terv
vgrehajtsra vonatkoz kzs szndk (joint intention) egyttes ismerett. Az gensek csak ebben az
esetben kezdhetnek cselekedni.
7.4. Versengs
A tbbgenses krnyezeteknek nem mindegyike ll egyttmkd gensekbl. Az egymsnak ellentmond
mkds gensek versenyben (competition) vannak egymssal. Erre egy pldt jelentenek a kt jtkost
ignyl, de zrus sszeg jtkok, mint amilyen a sakk. A 6. fejezetben lthattuk, hogy a sakkoz gensnek
figyelembe kell vennie az ellenfl kvetkez nhny lehetsges lpst is. Azaz egy verseng krnyezetben lev
gensnek (a) fel kell ismernie, hogy vannak ms gensek, (b) meg kell hatroznia a tbbi gens lehetsges
terveit, (c) meg kell hatroznia, hogy a tbbi gens hogyan tervezi a sajt terveivel val klcsnhatst, s (d) el
kell dntenie, hogy ezek fnyben mi a legjobb cselekvs. A versengs, hasonlan az egyttmkdshez, a tbbi
gens tervnek modelljt ignyli. Msrszrl, egy verseng krnyezetben nincs elhatrozs egy sszetett terv
mellett.
A 12.4. alfejezet felvzolta a jtkok s a feltteles tervksztsi problmk kztti analgit. A 12.10. brn
szerepl feltteles tervkszt algoritmus olyan tervet kszt, amely a krnyezetrl a legrosszabb esetet
felttelezve is mkdik, gy olyan versenyhelyzetekben is alkalmazhat, ahol az genst csak a siker vagy a
buks rdekli. Amikor az gens s ellenfelei a terv kltsgeivel is foglalkoznak, akkor a minimax megolds a
helynval. Eddig nagyon kevs munkt fordtottak a minimax mdszer olyan mdszerekkel val
kombinlsra, mint a rszben rendezett tervkszts vagy a HFH-tervkszts, ami tlmutat a 6. fejezetben
hasznlt llapottr-keressi modellen. A versengs krdsre a jtkelmlettel foglalkoz 17.6. alfejezetben mg
visszatrnk.
8. sszefoglals
400
Created by XMLmind XSL-FO Converter.
8.2. Feladatok
12.1.
Vizsgljuk meg figyelmesen a 12.1. alfejezetben az id s az erforrsok reprezentcijt.
a. Mirt jobb, ha egy cselekvs kvetkezmnye az Idtartam(d), mint ha a cselekvsnek egy IDTARTAM:d
alak kln mezje lenne? (Segtsg: vegyk figyelembe a feltteles kvetkezmnyeket s a diszjunktv
kvetkezmnyeket.)
b. Az ERFORRS: m mirt egy kln mez a cselekvsben, nem pedig egy kvetkezmny?
12.2.
Egy fogyeszkz (consumable resource) egy olyan erforrs, ami (rszlegesen) felhasznlsra kerl a
cselekvsben. Pldul a motor beszerelse az autba csavarokat ignyel. Miutn a csavarokat felhasznltuk, mr
nem hasznlhatk tovbbi rgztsekhez.
a. Magyarzza meg, hogyan mdostsuk a 12.3. bra reprezentcijt gy, hogy 100 kiindul csavarunk legyen
az E1 motor 40 csavart, az E2 pedig 50 csavart ignyel. A + s szimblumok felhasznlhatk az
erforrsokat ler kvetkezmnyliterlokban.
b. Mutassa meg, hogy a rszben rendezett tervksztsben alkalmazott okozati kapcsolatok s cselekvsek
kztti tkzs (conflict) defincijt hogyan kell mdostani, hogy a fogyeszkzket kezelje.
c. Nhny cselekvs, pldul a gyr elltsa csavarokkal vagy egy aut feltankolsa, nvelheti az erforrsok
kszlett. Egy erforrs monoton nem nvekv, ha egyetlen cselekvs sem nveli. Magyarzza meg, hogyan
hasznlhat ez a tulajdonsg a keressi tr megmetszshez.
12.3.
Adjon dekompozcit a 12.7. bra KiviteleztVeszFel s EngedlytSzerez lpseire, s mutassa meg, hogy a
dekomponlt rsztervek hogyan llnak ssze egy teljes tervv.
404
Created by XMLmind XSL-FO Converter.
405
Created by XMLmind XSL-FO Converter.
407
Created by XMLmind XSL-FO Converter.
Fontos
Mindazonltal tegyk fel, hogy az A90 tnylegesen a helyes s kvetend terv. De mit is rtnk ezen a
kijelentsen? Ahogy mr a 2. fejezetben kifejtettk, ez a kijelents azt takarja, hogy a vgrehajthat
sszes lehetsges terv kzl az A90 az, amelyik a krnyezetre vonatkoz adott informci mellett
vrhatan az gens teljestmnynek legnagyobb mrtkt biztostja. A teljestmny foka magban
foglalja a jrathoz idben val kirst a repltrre, tovbb a repltren val hossz, rtelmetlen
vrakozs s a gyorshajts miatti megbrsgols elkerlst. Az gens rendelkezsre ll informci
ezen kimenetelek kzl egyiket sem szavatolja az A90 esetn, de bizonyos mrtk hihetsgt nyjtja
annak, hogy azok be fognak kvetkezni. Ms tervek, mint pldul az A120, megnveln az gens hitt
abban, hogy idben kirnek a repltrre, de egyben megnveln a hossz vrakozs valsznsgt is.
A helyes cselekedet az sszer dnts (rational decision) ezrt fgg mind a klnbz clok
viszonylagos fontossgtl, mind pedig a megvalsulsuk valsznsgtl s mrtktl. Az alfejezet
htralev rszben ezeket a gondolatokat szeretnnk hangslyozni, elksztvn az ebben s a
kvetkez fejezetekben bemutatott bizonytalan kvetkeztets s az sszer dnts ltalnos
elmleteinek a kifejlesztst.
Bizonytalansg
Ebben az alfejezetben a bizonytalan tuds termszett vizsgljuk meg kzelebbrl. Egy egyszer diagnosztikai
pldn keresztl mutatjuk be az rintett fogalmakat. A diagnosztika legyen az orvosi, gpjrm-javtsi vagy
brmi egyb olyan feladat, amely szinte mindig tartalmaz bizonytalansgot. Hogy lssuk a logikai
megkzelts sikertelensgt, prbljuk meg egy fogorvosi diagnosztikai rendszer szablyait meghatrozni
elsrend logika segtsgvel. Tekintsk a kvetkez szablyokat:
p Tnet(p, Fogfjs) Betegsg(p, Lyuk)
A gond az, hogy ez a szably rossz. Nincs minden fogfjs betegnek lyukas foga; nhnyuknak lehet
nysorvadsa vagy tlyoga, vagy valamilyen ms problmja.
p Tnet(p, Fogfjs) Betegsg(p, Lyuk)
Tlyog)
Betegsg(p, nysorvads)
Betegsg(p,
Sajnos, ahhoz, hogy igazz tegyk a szablyt, kzel vgtelen sok okot kellene hozztennnk. Megprblhatjuk a
szablyt ok-okozati szablly formlni:
p Betegsg(p, Lyuk) Tnet(p, Fogfjs)
De mg ez a szably sem lesz helyes, hiszen nem minden lyukas fog okoz fjdalmat. Az egyetlen mdja, hogy
kijavtsuk a szablyt, az az, hogy logikailag teljess tesszk: a bal oldalt ki kell bvteni minden olyan
lehetsges okkal, amely lyukas fogak esetn fogfjst okoz. De mg ebben az esetben is figyelembe kell venni a
diagnzis megllaptsnl annak lehetsgt, hogy a betegnek egymstl teljesen fggetlenl is lehet fogfjsa
s lyukas foga.
Prblkozsaink az elsrend logika alkalmazsra olyan terleteken, mint az orvosi diagnosztika, hrom f
okbl is kudarcot vallanak:
Lustasg (laziness): tl nagy munkt jelent az ok s okozatok teljes esemnyhalmaznak felsorolsa, amely
elengedhetetlenl szksges annak biztostsra, hogy egy szably mindig rvnyes legyen. Ezenkvl tl
krlmnyes az eredmnyl kapott hatalmas mret szablyok hasznlata.
Az elmleti tudatlansg (theoretical ignorance): az orvosi tudomnyterlet elmlete nem teljes.
A gyakorlati tudatlansg (practical ignorance): mg ha ismerjk is a teljes szablyrendszert, egy bizonyos
beteggel kapcsolatban akkor is lehetnk bizonytalanok, mert elfordulhat, hogy mg nem fejezdtt be, vagy
egyltaln nem vgezhet el az sszes szksges vizsglat.
Arrl van sz, hogy a fogfjs s a lyuk kztti kapcsolat egyik irnyban sem felttlen logikai kvetkezmny.
Ez jellemz az orvosi terletekre, valamint ms szakrti terletekre (jog, zlet, tervezs, autjavts,
kertszkeds, idpontok sszeegyeztetse stb.). Az gens tudsa legjobb esetben is csak egy bizonyos mrtk
meggyzdst vagy hiedelmet (degree of belief) nyjthat az adott kijelentsekkel kapcsolatban. A
meggyzdsi rtkek kezelsre az elsdleges eszkznk a valsznsg-szmts (probability theory) lesz,
amely egy 0 s 1 kztti szmszer meggyzdsi mrtket rendel az egyes mondatokhoz. (A bizonytalan
kvetkeztetsre alkalmas nhny ms lehetsges mdszerrl a 14.7. alfejezetben olvashatunk.)
Fontos
A valsznsg lehetsget nyjt a lustasgunkbl vagy tudshinyunkbl fakad bizonytalansg
kifejezsre (sszegzsre). Nem lehetnk biztosak abban, hogy mi knoz egy bizonyos beteget,
ugyanakkor hihetjk, hogy mondjuk 80% az esly arra azaz 0,8 a valsznsge annak , hogy a
betegnek van lyukas foga, ha fogfjsra panaszkodik. Azaz, vrakozsaink szerint az sszes, az gens
tudsa alapjn a jelenlegi szitucitl megklnbztethetetlen eset 80%-ban a pciensnek van lyukas
foga. Ezt a valsznsget statisztikai adatokbl vonhatjuk le az eddig vizsglt fogfjs betegek 80%nak lyukas volt a foga , vagy valamilyen ltalnos szablybl, illetve tnyek kombincijbl
szrmaztathatjuk. A 80% azokat az eseteket foglalja magban, amikor minden olyan tnyez jelen van,
amely hatsra a lyuk fogfjssal jr, valamint amikor a betegeknek teljesen fggetlenl van fogfjsa
s lyukas foga is. A hinyz 20%-ban pedig a fogfjs sszes tbbi lehetsges oka tallhat, amelyek
megerstshez vagy tagadshoz tl lustk vagy tudatlanok vagyunk.
Egy adott kijelentshez rendelt 0 valsznsg annak az egyrtelm meggyzdsnek felel meg, hogy a mondat
lltsa hamis, mg az 1 valsznsg egyenrtk azzal a hatrozott meggyzdssel, hogy a mondat lltsa
409
Created by XMLmind XSL-FO Converter.
Bizonytalansg
igaz. A 0 s 1 kztti valsznsgek a mondat igazsgtartalmban val hit kzbens mrtkeinek felelnek meg.
Az llts valjban persze vagy igaz, vagy hamis. Fontos teht megjegyeznnk, hogy a meggyzds mrtke
s az igazsgtartalom mrtke klnbz fogalmak. A 0,8 valsznsg nem jelent 80%-ban igaz-at, hanem
egy 80%-os mrtk meggyzdst vagyis egy igen ers elvrst (remnyt) az llts igazsgval szemben.
Kvetkezskppen a valsznsg-szmts a logikval azonos ltelmleti llsfoglalst hordoz nevezetesen,
hogy a vilgban a tnyek vagy rvnyesek, vagy nem. Az igazsg mrtke, mint a meggyzds mrtknek az
ellentte, a fuzzy logika (fuzzy logic) trgya, amelyet a 14.7. alfejezetben trgyalunk.
A logikban egy olyan llts, mint a pciensnek van lyukas foga az interpretcijtl s a vilgtl fggen
vagy igaz, vagy hamis; csak akkor igaz, ha az a tny, amelyre hivatkozik, megfelel a tnyllsnak. A
valsznsg-szmtsban egy olyan mondat, mint 0,8 annak a valsznsge, hogy a betegnek lyukas a foga
az gens meggyzdst fejezi ki, s nem kzvetlenl a valsgra vonatkozik. Ez a meggyzds az gens
addigi szlelseitl fgg. Az szlelsek alkotjk azt a tnyt vagy tnyllst (evidence), amelyen a valsznsgi
kijelentsek alapulnak. Tegyk fel pldul, hogy az gens kihz egy lapot egy megkevert krtyapaklibl.
Mieltt rnz a lapra, 1/52 valsznsget kell rendelnie a mell az llts mell, hogy a kihzott lap a pikk sz.
Megnzs utn ugyanennek a valsznsge vagy 0, vagy 1. Vagyis, egy kijelentshez rendelt valsznsg
inkbb annak felel meg, hogy egy logikai llts (vagy annak tagadsa) kvetkezik-e a tudsbzisbl, mint
annak, hogy igaz-e vagy sem. Ahogy a tudsbzishoz hozzadott lltsok megvltoztatjk az abbl levonhat
kvetkeztetseket, ugyangy a valsznsg is megvltozik, amikor tbb tny birtokba jutunk. 1
Ebbl kvetkezen minden valsznsgi kijelentsnek hivatkoznia kell azokra a tnyekre, amelyek alapjn az
adott valsznsg az lltshoz lett rendelve. Amint egy gens j szlelsek birtokba jut, ezek
figyelembevtelvel mdostja a valsznsgek becslst. Mieltt tnyek birtokba jutunk, elzetes, illetve a
priori (prior) vagy felttel nlkli (unconditional) valsznsgrl beszlnk, a tnyek birtokban pedig
utlagos, illetve a posteriori (posterior) vagy feltteles (conditional) valsznsgrl. Az gens a legtbb
esetben rendelkezni fog bizonyos tnyekkel az rzkelsei hatsra, s rdekelt lesz az ltala felgyelt
kimenetelek a posteriori valsznsgeinek kiszmtsban.
410
Created by XMLmind XSL-FO Converter.
Bizonytalansg
Fontos
A dntselmlet alapgondolata szerint egy gens akkor s csak akkor racionlis, ha olyan cselekvst
vlaszt, amely az adott cselekvs sszes lehetsges kimenetelre tlagolt legmagasabb vrhat hasznot
hozza. Ezt hvjk a Maximlis Vrhat Haszon (MVH, Maximum Expected Utility, MEU) elvnek.
Az elv mkdst a 6. fejezetben lthattuk, amikor az ostblajtk optimlis lpst vizsgltuk rviden.
A ksbbiekben ltni fogjuk, hogy ez az elv teljesen ltalnos rvny.
13.1. bra - Dntselmleti gens, amely racionlis cselekvseket vlaszt ki. A lpseket
a kvetkez t fejezetben rszletezzk.
2. Valsznsgi alapfogalmak
Miutn fellltottuk a racionlis gens ltalnos kerett, szksgnk lesz egy formlis nyelvre a bizonytalan
tuds lershoz s a kvetkeztetshez. Minden olyan jellsnek, amely a meggyzdsnk foknak lersra
szolgl, kpesnek kell lennie kt f dolog kezelsre: az egyik a kijelentsek jellege, amelyekhez meggyzdsi
mrtket akarunk rendelni, a msik pedig a meggyzds mrtknek az gens tapasztalattl val fggse. A
valsznsg-elmlet itt bemutatott vltozata az tletlogika egy kiterjesztst hasznlja lltsaihoz. A
tapasztalattl val fggs az a priori valsznsgi kijelentsek s a feltteles valsznsgi lltsok szintaktikai
megklnbztetsben tkrzdik. Az a priori valsznsgi kijelentseket akkor alkalmazzuk, mieltt mg
tnyek birtokba jutnnk, mg a feltteles valsznsgi kijelentsek explicit mdon tartalmazzk a megszerzett
tnyeket.
411
Created by XMLmind XSL-FO Converter.
Bizonytalansg
2.1. lltsok
A hiedelmi mrtkeket mindig lltsokhoz (propositions) rendeljk amelyek ez s ez a helyzet tpus
kijelentsek. Az lltsok lersra eddig kt formlis nyelvet az tletlogikt s az elsrend logikt
hasznltuk. Ez az alfejezet egy olyan nyelvet r le, amelyet a valsznsg-elmlet jellegzetesen hasznl, s
amely valamelyest kifejezbb az tletlogiknl. (A 14.6. alfejezet azokat a mdszereket taglalja, amelyek
megadjk, hogy milyen hiedelmi mrtkek tulajdonthatk az elsrend logika egyes kijelentseinek.)
A nyelv alapeleme a valsznsgi vagy vletlen vltoz (random variable), ami gy tekinthet, mint ami egy
kezdetben ismeretlen llapot vilg egy rszre vonatkozik. Pldul a Lyuk a bal als blcsessgfogam
esetleges lyukassgt mutatja. A vletlen vltozk a knyszerkielgtsi problmknl megismert CSPvltozkhoz s az tletlogiknl hasznlt tletszimblumhoz hasonl szerepet jtszanak.
A vletlen vltozkat mindig nagybetvel kezdjk. (Ugyanakkor az ismeretlen vletlen vltozkat vltozatlanul
kis- s egybets nevekkel fogjuk jellni, pldul: P(a) = 1 P(a).)
Minden valsznsgi vltozhoz tartozik egy rtktartomny (domain), amelybl az rtkeit veheti. Pldul a
Lyuk tartomnya az igaz, hamis lehetne.2 (Az rtkeket kisbets nevekkel fogjuk jellni.) Az lltsok
legegyszerbb fajtja azt jelenti ki, hogy a valsznsgi vltoz valamilyen konkrt rtket vesz fel a
tartomnyon bell. Pldul a Lyuk = igaz azt reprezentlja, hogy nekem valban lyukas a bal als
blcsessgfogam.
A vletlen vltozk a CSP-vltozkhoz hasonlan tipikusan hrom csoportba sorolhatk a tartomny
fajtjtl fggen:
(Boole-tpus) logikai vletlen vltozk (Boolean random variables), mint a Lyuk, amelyeknek az igaz,
hamis a tartomnya. Az olyan lltsokat, mint a Lyuk = igaz gyakran rvidtve, csak a kis kezdbets
nevvel lyuk fogjuk jellni, mg a Lyuk = hamis llts rvidtett jellse: lyuk.
Diszkrt vletlen vltozk (discrete random variables), amelyek specilis esetben logikai vltozk is
lehetnek, egy megszmllhat tartomnybl vesznek fel rtket. Pldul az Idjrs tartomnya a napos,
ess, felhs, havazik lehet. A tartomny rtkeinek egymst kizrknak s sszessgben kimertknek
(teljeseknek) kell lennik. Ha ez nem okozhat flrertst, akkor a havazik rvidts fogja jellni pldul az
Idjrs = havazik lltst.
Folytonos vletlen vltozk (continuous random variables), amelyek vals rtket vehetnek fel. A
tartomny lehet akr a teljes vals tengely, akr annak egy rszhalmaza, mint a [0, 1] intervallum. Pldul az
az llts, hogy X = 4,02 azt jelenti ki, hogy az X vletlen vltoz rtke pontosan 4,02. A vletlen vltozkra
vonatkoz lltsok egyenltlensgek is lehetnek, mint pldul X 4,02.
Nhny kivteltl eltekintve, mi a diszkrt esetre fogunk koncentrlni.
Az sszetett lltsok ltrehozshoz az olyan elemi lltsok, mint a Lyuk = igaz vagy a Fogfjs = hamis,
brmely szoksos logikai kapcsolat felhasznlsval kombinlhatk. Pldul a Lyuk = igaz Fogfjs = hamis
egy olyan llts, amelyhez valamilyen hihetsgi (hihetetlensgi) mrtket rendelhetnk. Ahogy az elz
bekezdsben lertuk, a fenti lltst gy is jellhetjk, hogy fogszuvasods fogfjs.
Egyesek elvrsa szerint a tartomnyt halmazknt kellene megadni: {igaz, hamis}. Mi lltsok n-eseknt rjuk le, mivel a ksbbiekben ez
megknnyti egy rendezs hozzrendelst.
3
A valsznsg-elmlet szmos formja az elemi esemnyt, ms nven mintt (sample point) egy primitvnek tekinti. A vletlen vltozt
pedig, mint egy fggvnyt definilja, amelynek bemenete egy elemi esemny, kimenetknt pedig a megfelel tartomny egy rtkt adja. Ez
a megkzelts taln ltalnosabb, de ugyanakkor kevsb intuitv.
2
412
Created by XMLmind XSL-FO Converter.
Bizonytalansg
Fontos megjegyeznnk, hogy P(a) csak akkor hasznlhat, ha nincs semmilyen ms informci a birtokunkban.
Amint ismertt vlik valamilyen j informci, a tovbbiakban mr a adott j informci melletti feltteles
valsznsgvel kell kvetkeztetnnk. A feltteles valsznsgekkel a kvetkez alfejezet foglalkozik.
Bizonyos esetekben elfordulhat, hogy beszlni szeretnnk egy vletlen vltoz sszes lehetsges rtknek
valsznsgrl. Ilyen esetekben a P(Idjrs) kifejezs hasznlhat, amely az idjrs minden egyes
llapothoz rendelt valsznsgi rtkekbl kpzett vektort jelli. Kvetkezskppen, ahelyett hogy az albbi
ngy egyenletet rnnk le
P(Idjrs = napos) = 0,7
P(Idjrs = ess) = 0,2
P(Idjrs = felhs) = 0,08
P(Idjrs = havazik) = 0,02
413
Created by XMLmind XSL-FO Converter.
Bizonytalansg
adja meg. Ez az egyttes valsznsg-eloszls egy 16 elem, 2 2 4-es tblzattal reprezentlhat. A teljes
egyttes valsznsg-eloszls minden egyes elemi esemny valsznsgt, s gy a krdses vilggal
kapcsolatos sszes bizonytalansgot meghatrozza. A 13.4. alfejezetben ltni fogjuk, hogy a teljes egyttes
valsznsg-eloszls alapjn brmely valsznsgi krds megvlaszolhat.
Folytonos vltozk esetn az eloszls nem foglalhat ssze tblzatos formban, mivel a lehetsges rtkek
szma vgtelen. Ehelyett annak valsznsge, hogy egy valsznsgi vltoz egy adott x rtket vesz fel,
ltalban x egy paramterezett fggvnyeknt definilhat. Pldul az X vletlen vltoz jellje a holnapi
hmrsklet maximumt Berkeleyben. Ezzel a
P(X = x) = U[18, 26](x)
kijelents azt a hiedelmet fejezi ki, hogy X egyenletes eloszlst mutat 18 s 26 C kztt. (Nhny hasznos
folytonos valsznsgi vltoz defincijt az A) fggelkben talljuk meg.) A folytonos valsznsgi
vltozkra vonatkoz valsznsgi eloszlst valsznsg-srsgfggvnynek (probability density
function) nevezzk. A srsgfggvnyek jelentse klnbzik a diszkrt eloszlsoktl. Pldul a
korbbiakban megadott hmrskleteloszlsbl kiindulva P(X = 20,5) = U[18, 26](20,5) = 0,125/C addik. Ez
nem azt jelenti, hogy annak az eslye, hogy a holnapi maximlis hmrsklet pontosan 20,5 C lesz 12,5%;
ennek a valsznsge termszetesen 0. Technikailag ez azt jelenti, hogy annak a valsznsge, hogy a
krdses hmrsklet a 20,5 C egy kicsiny krnyezetbe fog esni, hatrrtkt tekintve egyenl azzal, hogy a
0,125-t elosztjuk a szakasz C-ban megadott szlessgvel:
azt jelenti, hogy ha egy betegnl megfigyeltk, hogy fogfjsa van, s semmilyen ms informcink nincs vele
kapcsolatban, akkor annak a valsznsge, hogy szuvas a foga 0,8. Egy P(lyuk) tpus a priori valsznsg
tekinthet a P(lyuk ) feltteles valsznsg specilis esetnek, ahol a felttelt a semmi bizonytk jelenti.
A feltteles valsznsgek megadhatk felttel nlkliek segtsgvel. A definci
alakban is, amelyet szorzatszablynak (product rule) hvunk. A szorzatszablyt taln knnyebb megjegyezni:
ez abbl kvetkezik, hogy a s b egyttes teljeslshez, szksges, hogy b igaz legyen, valamint hogy a is igaz
legyen b felttele mellett. A szablyt megadhatjuk fordtva is:
P(a b) = P(b a)P(a)
A opertor a lehet legkevesebb elzmnyt jelenti, azaz a P(a b|c d) P((a b)|(c d))-vel egyenrtk.
414
Created by XMLmind XSL-FO Converter.
Bizonytalansg
Bizonyos esetekben knnyebb a konjunkcik felttel nlkli (a priori) valsznsgeit hasznlni, azonban mi az
esetek tbbsgben feltteles valsznsgeket fogunk alkalmazni valsznsgi kvetkeztetseink eszkzeknt.
A P jellst hasznlhatjuk feltteles eloszlsokra is. P(X Y) a P(X = xi Y = yi) rtkeit adja meg minden
lehetsges i-re, j-re. Annak pldjaknt, hogy ez mennyivel tmrebb teszi a jellst, kpzeljk el a
szorzatszably alkalmazst minden olyan esetre, ahol az a s b lltsok X s Y bizonyos rtkeit veszik fel. A
kvetkez egyenleteket fogjuk kapni:
P(X = x1 Y = y1) = P(X = x1 Y = y1) = P(Y = y1)
P(X = x1 Y = y2) = P(X = x1 Y = y2) = P(Y = y2)
Ne felejtsk, hogy ez egy olyan egyenlethalmaz jellsre szolgl, amely kapcsolatba hozza a tblzatok
megfelel elemeit, s nem a tblzatok mtrix szorzsrl van sz. Csbt, de helytelen a feltteles
valsznsgeket bizonytalansggal kiegsztett logikai implikcikknt tekinteni. Pldul a P(a b) = 0,8
lltst nem lehet gy rtelmezni, hogy amikor csak igaz b, P(a) 0,8-del egyenl. Ez kt okbl is tves: elszr is
P(a) mindig a elzetes valsznsgt, s nem a valamilyen tny meglte esetn alkalmazand utlagos
valsznsgt jelli; msrszrl pedig a P(a|b) = 0,8 csak akkor alkalmazhat, ha b az egyetlen tny, amelynek
birtokban vagyunk. Ha ismernk egy tovbbi c informcit is, akkor a hihetsgi mrtkt P(a b c) fogja
adni, amely akr fggetlen is lehet P(a b)-tl. Pldul c megadhatja kzvetlenl azt is, hogy a igaz vagy hamis.
Ha megvizsglunk egy beteget, aki fogfjsra panaszkodik, s tallunk egy lyukas fogat, akkor a tovbbi, lyuk
informcinak jutottunk birtokba, s gy termszetesen, arra a kvetkeztetsre fogunk jutni, hogy
P(lyuk fogfjs lyuk) = 1,0.
3. Valsznsgi aximk
Az eddigiekben az lltsokra, az a priori, valamint a feltteles valsznsgi kijelentsekre vonatkoz szintaxist
definiltunk. A tovbbiakban meg kell fogalmaznunk a valsznsgi kijelentsek valamilyen szemantikjt is.
Ezt azokkal az alapvet aximkkal kezdjk, amelyek a valsznsgi sklt s annak vgpontjait hatrozzk
meg:
1. Minden valsznsg 0 s 1 kz esik. Brmely a kijelentsre
0 P(a) 1
2. A biztosan igaz (azaz rvnyes) lltsok valsznsge 1, a biztosan hamis (azaz kielgthetetlen) lltsok
pedig 0.
P(igaz) = 1 P(hamis) = 0
Ezutn egy olyan aximra van szksgnk, amely a logikailag sszefgg lltsokat kapcsolja ssze. A
legegyszerbb, ha a diszjunkcira vonatkoz valsznsget az albbiak szerint definiljuk:
3. A diszjunkci valsznsge
P(a b) = P(a) + P(b) P(a b)
Ez utbbi szablyt knny megjegyezni arrl, hogy azok az esetek, ahol a igaz s azok az esetek, ahol b igaz,
egytt termszetesen lefedik azokat az eseteket, ahol a b igaz; ugyanakkor a kt halmazba es eseteket
sszeadva ktszer szmoljuk azokat, amelyek a halmazok kzs rszbe esnek, gy ki kell vonnunk P(a b)-t.
Ezt a hrom aximt gyakran nevezik Kolmogorov-aximknak (Kolmogorovs axioms) az orosz
matematikus Andrei Kolmogorov emlkre, akinek a nevhez fzdik az ezen alapaximkbl kiindul
valsznsg-elmlet felptse. Vegyk szre, hogy az aximk csak az a priori valsznsgekkel, s nem a
feltteles valsznsgekkel foglalkoznak; ennek oka, hogy az utbbiakat mr a korbbiakban definiltuk a
(13.1) egyenlet szerint.
Fontos
415
Created by XMLmind XSL-FO Converter.
Bizonytalansg
A kvetkeztets harmadik sora nmagban is hasznos tny s kiterjeszthet a Boole-tpus logikai esetbl az
ltalnos diszkrt esetre. Legyen d1, , dn a D diszkrt vltoz rtelmezsi tartomnya. Knny megmutatni
(13.2. feladat), hogy
416
Created by XMLmind XSL-FO Converter.
Bizonytalansg
Azaz, egyetlen vltoz tetszleges valsznsgi eloszlsa sszegzsnek 1-et kell adnia.6 Igaz az is, hogy
vltozk tetszleges halmaznak brmely egyttes valsznsgi eloszlst sszegezve, eredmnyl szintn 1-et
kapunk: ennek beltsra elegend egyetlen tbbdimenzis, az eredeti vltozk rtelmezsi tartomnyai
Descartes-szorzataknt ltrehozott tartomny felett rtelmezett vltozt ltrehoznunk.
Fontos
Emlkezznk, hogy brmely a llts egyenrtk minden olyan elemi esemny diszjunkcijval, ahol
a igaz; nevezzk az esemnyek ezen halmazt e(a)-nak. Emlkezznk arra is, hogy az elemi
esemnyek egymst klcsnsen kizrjk, gy a 2. axima szerint az ilyen esemnyek konjunkcija
nulla. Kvetkezskppen a 3. aximbl a kvetkez egyszer sszefggsre juthatunk: Egy llts
valsznsge megegyezik azon elemi esemnyek valsznsgeinek sszegvel, ahol az llts igaz,
azaz
Ez az egyenlet egyszer mdszert knl brmilyen llts valsznsgnek meghatrozsra, ha adott az sszes
elemi esemny valsznsgt meghatroz teljes egyttes valsznsg-eloszls (lsd 13.4. alfejezet). A
kvetkez alfejezetekben a valsznsgek kezelsnek tovbbi szablyait fogjuk szrmaztatni. Mindenekeltt
azonban az aximk megalapozottsgt vizsgljuk meg.
Az effajta krds vtizedekig vita trgya volt azok kztt, akik a valsznsgek hasznlatt tartottk egyedl
jogosnak a meggyzdsi mrtkek kifejezsre, s azok kztt, akik ms megkzeltsi mdokat javasoltak. Itt
most egy olyan rvelst mutatunk be a valsznsgi aximkkal kapcsolatban, amelyet elszr Bruno de Finetti
fejtett ki 1931-ben.
De Finetti rvelsnek kulcsa a meggyzdsi fok s a cselekvsek kztti sszefggs. A gondolat lnyege,
hogy ha egy gensnek van valamilyen szint meggyzdse egy a lltssal kapcsolatban, akkor kpesnek kell
lennie olyan tteket megadni, amelyek mellett mindegy, hogy az a lltsra, vagy ellene fogad. Kpzeljk el
gy, mint egy jtszmt kt gens kztt: az 1. gens szerint az n hiedelmem az a esemnyben 0,4. A 2. gens
ezutn szabadon dnthet, hogy a mellett vagy ellen fogad akkora tttel, amely a nyilatkozott hiedelemfokkal
konzisztens. Vagyis a 2. gens vlaszthatja azt, hogy arra fogad, hogy a esemny bekvetkezik, 4 dollrt tve az
1. gens 6 dollrjval szemben, vagy tehet 6 dollrt az 1. gens 4 dollrja ellenben arra fogadva, hogy a nem
fog bekvetkezni.7 Ha egy gens meggyzdsben nem tkrzdik pontosan a vilg ismerete, akkor
szmthatunk arra, hogy hossz tvon veszteni fog a szemben ll genssel szemben, akinek a hiedelmei
pontosabb kpet mutatnak a vilg llapotrl.
417
Created by XMLmind XSL-FO Converter.
Bizonytalansg
Fontos
De Finetti ennl sokkal ersebb lltst is bizonytott: ha az 1. gens olyan meggyzdsi mrtkekben
hisz, amelyek megsrtik a valsznsg-szmts aximit, akkor ltezik olyan stratgia a 2. gens
szmra, amely biztostja, hogy az 1. gens minden alkalommal veszteni fog. Teht ha elfogadjuk,
hogy egy gensnek a valsznsgeknek megfelelen kell feltennie a pnzt, akkor azt is el kell
fogadnunk, hogy sszertlen olyan meggyzdseket vallani, amelyek megsrtik a valsznsgi
aximkat.
Azt gondolhatjuk, hogy ez a fogadsdi nagyon krmnfont. Mi van pldul, ha valaki megtagadja, hogy
fogadjon? Elrontja-e ez az egsz rvelst? Minderre az a vlasz, hogy a fogadsos jtk elvont modellje annak a
dntsi helyzetnek, amelyben minden gens minden pillanatban elkerlhetetlenl rszt vesz. Minden cselekvs
(belertve a ttlensget is) egyfajta fogads, s a kvetkezmny tekinthet a fogads nyeremnynek. pp gy
nem utasthatjuk vissza a fogadst, mint ahogy nem llthatjuk meg az id mlst.
Nem mutatjuk be de Finetti elmletnek bizonytst, de mutatunk r egy pldt. Tegyk fel, hogy az 1. gens
meggyzdse megfelel a (13.3) egyenletnek. A 13.2. bra azt mutatja, hogy ha a 2. gens azt vlasztja, hogy 4
dollrt tesz a-ra, 3 dollrt b-re s 2 dollrt (a b)-re, akkor az 1. gens mindig veszteni fog, fggetlenl attl,
hogy a vagy b fog bekvetkezni.
13.2. bra - Mivel az 1. gens meggyzdse nem kvetkezetes, ezrt a 2. gens tud gy
tteket tenni, amely a s b kimeneteltl fggetlenl biztostja, hogy az 1. gens vesztsen
Ms, ersen filozofikus rvelseket is elterjesztettek a valsznsgek hasznlata mellett, amelyek kzl a
legnevezetesebb Cox s Carnap nevhez fzdik (Cox, 1946; Carnap, 1950). Lvn a vilg olyan, amilyen, a
gyakorlati pldk sokszor minden bizonytknl ersebbek. gy a valsznsg-szmtson alapul kvetkeztet
rendszerek sikere minden rvelsnl hatkonyabb volt a hitetlenek megtrtsben. A kvetkezkben azt
vizsgljuk meg, hogy az aximk hogyan hasznlhatk a kvetkeztetsben.
13.3. bra - A Fogfjs, Lyuk, Beakads vilg egy teljes egyttes valsznsg-eloszlsa
418
Created by XMLmind XSL-FO Converter.
Bizonytalansg
Az egyik ltalnos feladat a vltozk egy rszhalmaza vagy egyetlen vltoz fltti valsznsgi eloszls
kifejezse. Pldul az els sor bejegyzseinek sszege a lyuk felttel nlkli vagy peremeloszlst8 (marginal
probability) adja:
P(lyuk) = 0,108 + 0,012 + 0,072 + 0,008 = 0,2
Ezt a folyamatot marginalizlsnak (marginalization) vagy kitlagolsnak (summing out) hvjuk, mivel a
Lyuk-on kvli vltozkat kitlagoljuk. A kvetkez ltalnos behatrolsi szablyt fogalmazhatjuk meg a
vltozk tetszleges Y s Z halmaza esetn:
Azaz, egy Y feletti eloszls megkaphat, ha az sszes tbbi vltozt kitlagoljuk az Y-t tartalmaz egyttes
eloszlsokbl a szorzat szablyban
Ellenrzskppen kiszmthatjuk annak valsznsgt, hogy nincs lyuk, de tudjuk, hogy fogfjs igen:
Vegyk szre, hogy a fenti kt szmtsban az 1/P(fogfjs) konstans rtk marad fggetlenl attl, hogy a
Lyuk mely rtkt szmtjuk. Valjban ez egy, a P(Lyuk fogfjs)-t normalizls (normalization)
konstansnak tekinthet, amely biztostja, hogy a feltteles valsznsgek sszege 1 lesz. A valsznsgekkel
foglalkoz fejezetekben az ilyen konstansokat a-val fogjuk jellni. E jells segtsgvel a kt elz kifejezs
egybefoglalhat:
Azrt hvjk gy, mert a biztostsi matematikusok/statisztikusok ltalnos gyakorlata szerint a megfigyelt gyakorisgokat a biztostsi
tblzatok szlre (margjra) szoktk rni.
8
419
Created by XMLmind XSL-FO Converter.
Bizonytalansg
ahol az sszegzst az sszes lehetsges y fltt vgezzk (azaz az Y meg nem figyelt vltozk rtkeinek sszes
lehetsges kombincija esetn). Vegyk szre, hogy az X, E s Y vltoz egyttesen a vltozk teljes halmazt
alkotja az adott trgytartomnyban, gy P(X, e, y) egyszeren a teljes valsznsgi eloszls egy valsznsgi
rszhalmaza. Az algoritmust a 13.4. bra mutatja.
13.4. bra - A valsznsgi kvetkeztets egy olyan algoritmusa, amely valamely teljes
egyttes valsznsgi eloszls bejegyzseit veszi szmba
Az eljrs ciklusa mind X, mind Y sszes rtke fltt fut, szmba vve minden olyan elemi esemnyt, amely e
rgztett rtke mellett lehetsges, az egyttes valsznsgi tbla alapjn sszegzi ezek valsznsgeit, s
normalizlja az eredmnyeket.
Ha adott a teljes egyttes valsznsgi eloszls, akkor a FELSOROL-EGYTTES-KRDEZS egy teljes algoritmus,
amely alkalmas minden diszkrt vltozra vonatkoz valsznsgi lekrdezs megvlaszolsra. Azonban nem
minsthet jnak: egy n db Boole-tpus logikai vltoz ltal lert tartomnyban O(2n) mret bemeneti tblra
van szksge, s a tbla feldolgozsa is O(2n) idt ignyel. Vals problmk esetn nem csupn hrom, hanem
tbb szz vagy tbb ezer vletlen vltoz figyelembevtelre van szksg. Nagyon hamar teljesen
kivitelezhetetlenn vlik a szksges hatalmas szm valsznsg definilsa nem ltezik ugyanis olyan
tapasztalat, amellyel a tblzat egyes bejegyzsei kln-kln becslhetk lennnek.
Ezrt a tblzatos formban megadott teljes egyttes valsznsgi eloszls a gyakorlatban nem hasznlhat
eszkz kvetkeztet rendszerek felptsre (mindemellett a fejezet vgn tallhat trtneti megjegyzsekben
tallkozhatunk egy ilyen mdszeren alapul vals alkalmazssal). E technikt gy kell tekintennk, mint egy
elmleti alapot, amelyre a hatkonyabb mdszerek plhetnek. A fejezet tovbbi rszeiben bemutatjuk azokat az
alaptleteket, amelyekre szksgnk lesz a 14. fejezet vals rendszereinek kifejlesztshez.
420
Created by XMLmind XSL-FO Converter.
Bizonytalansg
5. Fggetlensg
Bvtsk ki a 13.3. brn lthat teljes egyttes valsznsgi eloszlst egy negyedik, Idjrs vltozval. Ezzel
a teljes egyttes valsznsgi eloszls P(Fogfjs, Beakads, Lyuk, Idjrs) lesz 32 bejegyzssel (mivel az
Idjrs vltoznak ngy rtke lehet). A teljes eloszls a 13.3. brn mutatott tblzat ngy pldnyt
minden egyes idjrstpusra egyet fogja magban foglalni. Termszetes krdsnek tnik, hogy vajon ezeknek
a tblzatpldnyoknak mi az egymshoz s az eredeti hromvltozs tblhoz val viszonyuk? Hogyan fgg
ssze pldul a P(fogfjs, beakads, lyuk, Idjrs = felhs) a P(fogfjs, beakads, lyuk)-kal?
A megvlaszols egyik lehetsges mdja a szorzatszably alkalmazsa:
P(fogfjs, beakads, lyuk, Idjrs = felhs) = P(Idjrs = felhs|fogfjs, beakads,
lyuk)P(fogfjs, beakads, lyuk)
Amennyiben eltekintnk az isteni hatalommal br pciensektl, nem gondolhatjuk komolyan, hogy valakinek a
fogszati problmi befolysoljk az idjrst. Ezrt sszernek tnik a kvetkez kijelents:
P(Idjrs = felhs fogfjs, beakads, lyuk) = P(Idjrs = felhs) (13.7)
lyuk,
Idjrs
felhs)
P(Idjrs
felhs)P(fogfjs,
Hasonl egyenlet rhat fel a P(Fogfjs, Beakads, Lyuk, Idjrs) eloszls minden egyes bejegyzshez. Az
ltalnos egyenletet pedig a kvetkezkppen rhatjuk fel:
P(Fogfjs, Beakads, Lyuk, Idjrs) = P(Fogfjs, Beakads, Lyuk)P(Idjrs)
Ebbl kvetkezen a ngyvltozs, 32 elemes tblzat ltrehozhat egy 8 s egy 4 elemes tblzatbl. A
dekompozci sematikus vzlatt a 13.5. (a) bra mutatja.
Azt a tulajdonsgot, ami alapjn a (13.7) egyenletet felrtuk fggetlensgnek (ms szval marginlis
fggetlensgnek vagy abszolt fggetlensgnek) (independence, marginal independence, absolute
independence) nevezzk. Esetnkben az idjrs fggetlen brkinek a fogszati problmitl. Az a s b
lltsok fggetlensge felrhat:
P(a b) = P(a) vagy P(b a) = P(b) vagy P(a b) = P(a)P(b) (13.8)
A fggetlensgi lltsok ltalban a tartomnnyal kapcsolatos ismereteken alapulnak. Mint korbban lthattuk,
ezek jelentsen lecskkenthetik a teljes egyttes eloszls meghatrozshoz szksges informci mennyisgt.
Ha a vltozk teljes halmaza sztbonthat fggetlen rszhalmazokra, akkor a teljes egyttes eloszls felbonthat
ezen rszhalmazok felett rtelmezett, egymstl fggetlen egyttes eloszlsokra. Pldul n fggetlen
pnzfeldobs eredmnynek egyttes eloszlsa P(C1, , Cn) felrhat n egyvltozs P(Ci) eloszls szorzataknt.
Mg kzzelfoghatbban: a fogszat s a meteorolgia fggetlensge j dolog, klnben a fogszati gyakorlat
mly meteorolgiai ismereteket ignyelne, s fordtva.
421
Created by XMLmind XSL-FO Converter.
Bizonytalansg
6. A Bayes-ttel s hasznlata
Az 2.3. szakasz - A priori valsznsg rszben definiltuk a szorzatszablyt (product rule), s rmutattunk,
hogy ez a konjunkci kommutativitsa miatt kt alakban rhat:
P(a b) = P(a | b)P(b)
P(a b) = P(b | a)P(a)
Ezt az egyenletet Bayes-szablyknt (Bayes rule) ismerjk (nevezik Bayes-trvnynek vagy Bayes-ttelnek
is).9 Ez az egyszer egyenlet az alapja az sszes korszer valsznsgi kvetkeztetst alkalmaz MIrendszernek. A tbbrtk vltozkat tartalmaz ltalnosabb eset a P jellsekkel a kvetkez trssal adhat
meg:
amelyet ismtelten gy kell rtelmezni, hogy egy egyenlethalmazt kpvisel, amely egyenletek mindegyike a
vltozk meghatrozott rtkeire vonatkozik. Lesznek olyan esetek, amikor egy mg ltalnosabb felrst
hasznlhatunk, valamilyen e httrtny felttelvel:
422
Created by XMLmind XSL-FO Converter.
Bizonytalansg
A Bayes-ttel els pillantsra nem tnik tl hasznlhatnak. Egyetlen feltteles valsznsg kiszmtshoz
hrom kifejezs egy feltteles s kt felttel nlkli valsznsg megadsa szksges.
A gyakorlatban a Bayes-ttel jl hasznlhat, mivel gyakran rendelkeznk a fenti hrom kifejezsre vonatkoz
j valsznsgi becslssel, mikzben a negyediket kell kiszmtanunk. Olyan feladatoknl, mint az orvosi
diagnosztika, gyakran ismerjk az ok-okozati kapcsolatok feltteles valsznsgeit, mikzben egy diagnzist
szeretnnk fellltani. Az orvos tudja azt, hogy az agyhrtyagyullads az esetek mondjuk 50%-ban
nyakmerevedst okoz a betegeknl. Az orvos ezenfell ismer nhny felttel nlkli tnyt is: annak elzetes
valsznsge, hogy egy beteg agyhrtyagyulladst kap, 1/50 000, mg annak elzetes valsznsge, hogy egy
betegnek merev a nyaka 1/20. Jellje s azt az lltst, hogy a betegnek megmerevedett a nyaka, valamint m azt
az lltst, hogy a betegnek agyhrtyagyulladsa van. Ekkor
Vagyis a nyakmerevedsrl panaszkod 5000 beteg kzl vrhatan csak egynek lesz agyhrtyagyulladsa.
Vegyk szre, hogy annak ellenre, hogy az agyhrtyagyulladsnak igen gyakori tnete (0,5 valsznsggel) a
nyakmereveds, annak valsznsge, hogy egy nyakmerevedses betegnek tnylegesen agyhrtyagyulladsa
van, mgis csekly. Ez abbl kvetkezik, hogy a nyakmereveds a priori valsznsge sokkal nagyobb, mint az
agyhrtyagyullads.
A 13.4. alfejezetben bemutattunk egy eljrst, amely segtsgvel elkerlhet a tny valsznsgnek
(pldnkban P(s)) megbecslse, gy, hogy a lekrdezett vltoz minden egyes rtkhez (itt m s m) egy
utlagos valsznsget szmtunk ki, majd az eredmnyeket normalizljuk. Hasonl eljrs alkalmazhat, ha a
Bayes-ttelt hasznljuk. Ismert, hogy
P(M|s) = P(s|m)P(m), P(s|m)P(m)
Kvetkezskppen ahhoz, hogy ezt a megkzeltst hasznlni tudjuk, P(s) helyett P(s m)-et kell tudnunk
becslni. Nincs ingyenebd van, hogy ez knnyebb s van, hogy nehezebb. A normalizlt Bayes-ttel
ltalnos alakja
P(Y|X) = P(X\Y)P(Y) (13.11)
ahol a a normalizl konstanst jelli, amely segtsgvel a P(Y|X) elemeinek sszegt 1-gy tudjuk tenni.
Fontos
A Bayes-ttellel kapcsolatban magtl rtetd krds, hogy mirt ismerhetjk a feltteles
valsznsget az egyik irnybl, a msik irnybl pedig nem. Az agyhrtyagyullads tartomnyban a
doktor tudhatja, hogy a nyakmerevedsbl csak minden 5000-dik esetben kvetkezik
agyhrtyagyullads, vagyis a doktor a tnetektl a kivlt ok fel, azaz diagnosztikai (diagnostic)
irnyban rendelkezik mennyisgi informcival. Egy ilyen orvosnak nincs szksge a Bayes-ttel
alkalmazsra. Sajnlatos mdon azonban a diagnosztikai tuds gyakran sokkal trkenyebbnek
bizonyul az ok-okozati sszefggseknl. Ha pldul hirtelen agyhrtyagyullads-jrvny tr ki, akkor
az agyhrtyagyullads elzetes valsznsge, P(m) megn. Az az orvos, aki a jrvnyt megelz
statisztikai adatok alapjn szmtotta ki P(m|s)-t, nem fogja tudni, hogyan vltoztassa meg az
agyhrtyagyulladsra vonatkoz rtket, mg az a doktor, aki a msik hrom rtk segtsgvel szmtja
P(m|s)-t, ltni fogja, hogy ennek rtke P(m)-mel arnyosan meg fog nni. Mg fontosabb azonban,
hogy a P(s|m) okozati informci rtkt a jrvny nem befolysolja, hiszen ez kizrlag az
agyhrtyagyullads lefolystl fgg. Ez a fajta kzvetlen ok-okozati s modellalap tuds alkalmazsa
teszi a valsznsgi rendszereket dnten robusztuss, amely a valdi vilgban val
felhasznlhatsghoz szksges.
Bizonytalansg
Lttuk, hogy a Bayes-ttel hasznos lehet az egyetlen tny pldul nyakmereveds felttelezse melletti
valsznsgi krdsek megvlaszolsnl. Nevezetesen, megmutattuk, hogy a valsznsgi informci
gyakran P(okozat ok) formban ll rendelkezsre. Mi trtnik azonban akkor, ha kett vagy tbb tny van a
birtokunkban? Pldul milyen kvetkeztetsre juthat a fogorvos, ha az az undok aclszondja lyukra akad a
beteg fj fogban? Ha ismerjk a teljes egyttes eloszlst (lsd 13.3. bra), a vlasz kiolvashat:
P(Lyuk fogfjs beakads) = 0,018, 0,016 0,871, 0,129
Azt is tudjuk ugyanakkor, hogy ez a megkzelts nagyszm vltoz esetn nem hasznlhat.
Megprblkozhatunk a Bayes-ttel alkalmazsval is, tfogalmazva a krdst:
P(Lyuk fogfjs beakads) = P(fogfjs beakads Lyuk)P(Lyuk) (13.12)
Ahhoz, hogy ez az tfogalmazs mkdjn, a Lyuk minden rtkre ismernnk kell a fogfjs beakads
egyttes bekvetkezsnek feltteles valsznsgt. Noha ez kt tnyvltoz esetn hasznlhat lehet,
nagyszm vltoz esetn mr nem alkalmazhat. Ha n figyelembe veend tnyvltoznk van (rntgen, dita,
szjhiginia stb.), akkor a megfigyelt rtkek lehetsges kombinciinak szma 2 n, amely esetek mindegyiknl
ismernnk kell a feltteles valsznsget. Ennyi ervel akr vissza is trhetnk a teljes egyttes valsznsgeloszls hasznlathoz. Ez vezetett arra, hogy a kutatk a valsznsg-szmts helyett kzelt mdszereket
kezdtek el hasznlni tbb tny egyttes figyelembevtelnl, mert br az gy kapott vlaszok pontatlanok, de
kevesebb szmolst ignyelnek.
A fenti t kvetse helyett inkbb tovbbi lltsokat kell keresnnk a trgytartomnyrl, amelyek lehetv
teszik a kifejezsek egyszerstst. A 13.5. alfejezetben bevezetett fggetlensg (independence) fogalma
knlja a megolds kulcst, azonban finomtst ignyel. Kellemes lenne, ha a Fogfjs s a Beakads
fggetlenek lennnek, de nem azok: ha a szonda megakad a fogban, akkor az valsznleg lyukas, ami
vrhatan fjdalmat okoz. Mindemellett, ezek a vltozk fggetlenek, amennyiben a lyuk meglte vagy hinya
adott tny. Mindkett a lyuk kzvetlen kvetkezmnye, azonban egyiknek sincs kzvetlen hatsa a msikra: a
fogfjs a fogidegek llapottl fgg, mg a szonda pontossgt a fogorvos szakrtelme hatrozza meg,
amelyben nincs szerepe a fogfjsnak.10 Ezt a tulajdonsgot matematikailag a kvetkezkppen rhatjuk le
P(fogfjs beakads Lyuk) = P(fogfjs Lyuk)P(beakads Lyuk) (13.13)
Ez az egyenlet a Lyuk tnye esetn a fogfjs s beakads kztt fennll feltteles fggetlensget (conditional
independence) fejezi ki. (13.13)-at (13.12)-be behelyettestve megkapjuk a lyuk valsznsgt:
P(Lyuk fogfjs beakads) = P(fogfjs Lyuk)P(beakads) Lyuk)P(Lyuk)
Ezzel ugyanarra az informciignyre jutottunk, mint a minden egyes tnyt kln hasznl kvetkeztetsnl: a
keress vltozjnak P(Lyuk) a priori valsznsgt, valamint minden egyes okozat sajt oknak fennllsa
esetn igaz feltteles valsznsgt kell ismernnk.
Kt vltoz, X s Y egy adott Z harmadik melletti feltteles fggetlensgnek ltalnos defincijta kvetkez
egyenlet adja:
P(X, Y Z) = P(X Z)P(Y Z)
Vegyk szre, hogy ez a kijelents valamelyest ersebb, mint amit a (13.13) egyenlet fejez ki. Ez utbbi csak a
Fogfjs s Beakads bizonyos rtkeihez rendel fggetlensget. ppgy, mint a (13.8) egyenletben az abszolt
fggetlensgnl, a kvetkez ekvivalens kifejezsek is hasznlhatk:
P(X Y, Z) = P(X Z) s P(Y X, Z) = P(Y Z)
A 13.5. alfejezetben megmutattuk, hogy a teljes fggetlensg bizonythatsga esetn a teljes egyttes
valsznsgi eloszls sztbonthat sokkal kisebb rszekre. Ugyanez lesz igaz feltteles fggetlensg esetn is.
Pldnak okrt, a (13.14) szerinti kijelents fennllsa esetn, a felbonts a kvetkezt jelentheti:
10
424
Created by XMLmind XSL-FO Converter.
Bizonytalansg
Fontos
Ezzel a mdszerrel az eredeti nagy tblzat felbonthat hrom kisebbre. Az eredeti tblzat ht
fggetlen szmot tartalmaz (231, mivel a szmok sszegnek 1-et kell adnia). A kisebb tblzatokban
t fggetlen szm tallhat (mindegyik feltteles valsznsgi eloszlsra 2 (211), valamint 211 a
Lyuk elzetes valsznsgi eloszlsra). Ez nem tnik tl nagy gyzelemnek, azonban, ha a Lyuk
tnye mellett n tnet bizonyul fggetlennek, akkor a reprezentci O(n) nagysgrendben nvekszik
O(2n) helyett. Kvetkezskppen a feltteles fggetlensgi kijelentsek lehetv teszik nagy
valsznsgi rendszerek kezelhetsgt, st, a feltteles fggetlensgi kijelentsek gyakrabban
rendelkezsre is llnak, mint az abszolt fggetlensgre vonatkozk. A Lyuk fogalmilag sztvlasztja
(separate) a Fogfjs-t s a Beakads-t, mivel mindkettnek kzvetlen kvetkezmnye. Nagy
valsznsgi tartomnyok feltteles fggetlensgen keresztl lazn kapcsold rszhalmazokra
trtn sztbontsa a modern MI trtnetnek legnagyobb eredmnyei kz tartozik.
A fogorvosi eset j plda az olyan, rendszeresen bekvetkez mintra, ahol egyetlen ok kzvetlenl befolysol
szmos olyan okozatot, amelyek az ok fennllsa esetn felttelesen fggetlenek. A teljes valsznsgi eloszls
az albbiak szerint rhat fel:
Az ilyen valsznsgi eloszlsokat naiv Bayes-modellnek hvjuk naiv, mert gyakran hasznljk
(egyszerstsknt) olyan esetekben is, ahol az okozati vltozk valjban nem fggetlenek az ok fennllsa
esetn. (A naiv Bayes-modellt nha Bayes-osztlyoznak (Bayes classifier) is hvjk nmileg
meggondolatlanul, ami arra sarkallta az igazi Bayes-kvetkeztetst alkalmazkat, hogy a naiv Bayes-modellt
egygy Bayes- (idiot Bayes) modellnek hvjk.) A naiv Bayes-modellek a gyakorlatban akkor is meglepen
jl mkdnek, ha a valsznsgi felttelezs nem igaz. A 20. fejezetben olyan mdszereket runk le,
amelyekkel a naiv Bayes-eloszlsok megtanulhatk a megfigyelsekbl.
425
Created by XMLmind XSL-FO Converter.
Bizonytalansg
addik.
13.6. bra - (a) Az gens beragad, miutn [1, 2]-ben s [2, 1]-ben is szellt szlel nincs
feltrhat biztonsgos hely. (b) A ngyzetek sztosztsa Ismert, Perem s Egyb
csoportokba az [1, 3]-ra vonatkoz lekrdezshez.
A dekompozci nagyon knnyv teszi az egyttes valsznsgi rtkek meghatrozst. Az els rsz a szell
feltteles valsznsg konfigurcijt adja adott csapda konfigurcinl; ennek rtke 1, ahol a szell
szomszdos egy csapdval, minden ms esetben 0. A msodik tag a csapdakonfigurci elzetes valsznsge.
A ngyzetek a tbbi ngyzettl fggetlenl 0,2 valsznsggel tartalmaznak csapdt; kvetkezskppen
Bizonytalansg
A fenti meglts hasznlathoz a lekrdezst olyan alakra hozzuk, amelyben a szell az sszes tbbi vltoz
felttele mellett van megadva, majd az egszet egyszerstjk a feltteles fggetlensg alapjn:
ahol az utols lps hasznlja ki a feltteles fggetlensget. E kifejezs els tagja nem fgg a tbbi vltoztl,
gy az sszegzs bellre vihet:
Fggetlensg esetn a (13.15) egyenlethez hasonlan az elz kifejezs tnyezkre bonthat, majd a tnyezk
sorrendje trendezhet:
Azaz, az [1, 3] (s a szimmetria miatt a [3, 1]) nagyjbl 31% valsznsggel tartalmaz csapdt. Hasonl
szmtsokbl (amelyet az olvas knnyen elvgezhet) a [2, 2]-re 86%-os valsznsggel addik csapda. A
wumpus gensnek hatrozottan el kell kerlnie a [2, 2]-t!
13.7. bra - C2,2 s C3,1 peremvltozk, az egyes modellek C(perem) rtkt mutat
konzisztens modelljei: (a) hrom, kt vagy hrom csapdt jelz modell C1,3 = igaz
mellett, s (b) kt, egy vagy kt csapdt jelz modell C1,3 = hamis mellett.
427
Created by XMLmind XSL-FO Converter.
Bizonytalansg
Ebben az alfejezetben azt mutattuk meg, hogy mg a ltszlag bonyolult problmk is pontosan
megfogalmazhatk valsznsg-elmleti alapokon, s meg is oldhatk egyszer algoritmusok segtsgvel.
Hogy hatkony megoldsokat kapjunk, a szksges sszegzseket a fggetlensgekre s feltteles
fggetlensgekre alapozva egyszerstjk. Ezek az sszefggsek gyakran egybeesnek a problma
rszproblmkra val felbontsra vonatkoz termszetes felfogsunkkal. A kvetkez fejezetben ilyen
sszefggsek formlis megjelentsre alkalmazunk mdszereket, valamint olyan algoritmusokat fejlesztnk
ki, amelyek hatkonyan hasznlhatk e reprezentcik alapjn elvgzett valsznsgi kvetkeztetsek
vgrehajtsra.
8. sszefoglals
Ez a fejezet arra mutat r, hogy a valsznsg megfelel mdja a bizonytalansgra vonatkoz
kvetkeztetseknek.
Bizonytalansg kvetkezik mind a lustasgbl, mind pedig a tudatlansgbl. sszetett, dinamikus vagy
hozzfrhetetlen vilgok esetn mindez elkerlhetetlen.
A bizonytalansg azt jelenti, hogy a tovbbiakban sok olyan egyszersts, amely deduktv kvetkeztets
sorn megengedhet, hamis eredmnyre vezet.
A bizonytalansg az gens kptelensgt fejezi ki arra, hogy egyrtelm dntst hozzon egy llts igazsgt
illeten. A valsznsgek az gens meggyzdsnek fokt fejezik ki.
Az alapvet valsznsgi lltsok magukban foglaljk az egyszer s az sszetett lltsokra vonatkoz a
priori s feltteles valsznsgeket (prior and conditional probabilities).
A teljes egyttes valsznsg-eloszls (full joint probability distribution) valsznsget rendel a vletlen
vltoz minden teljes kr rtk-hozzrendelshez. A teljes egyttes valsznsg-eloszls ltalban sokkal
nagyobb mret annl, semhogy ltrehozzuk vagy hasznljuk.
A valsznsgi aximk knyszereket jelentenek az lltsokhoz sszeren hozzrendelt valsznsgek
rtkre vonatkozan. Az aximkat megsrt gens bizonyos krlmnyek kztt sszertlenl fog
viselkedni.
Ha rendelkezsre ll a teljes valsznsgi eloszls, akkor a lekrdezsek megvlaszolst egyszeren a
lekrdezsek lltshoz tartoz elemi esemnyek bejegyzseinek sszeadsval elvgezhetjk.
A vletlen vltozk rszhalmazai kztt fennll abszolt fggetlensg (absolute independence) maga utn
vonja a teljes egyttes valsznsgi eloszls kisebb egyttes valsznsgi eloszlsokbl ll
szorzattnyezkre bontsnak lehetsgt. Ez nagymrtkben cskkentheti a bonyolultsgot, azonban a
gyakorlatban ritkn fordul el.
A Bayes-ttel (Bayes rule) lehetv teszi, hogy ismert feltteles valsznsgekbl szmtsunk ki
ismeretleneket, ltalban az okozat irnyba kvetkeztetve. Nagy mennyisg tny rendelkezsre llsa
esetn a Bayes-ttel alkalmazsa ugyanolyan szmtsigny-robbanshoz vezet, mint a teljes egyttes
valsznsgi eloszls.
A tartomnyon belli kzvetlen oksgi kapcsolatok okozta feltteles fggetlensg (conditional
independence) lehetv teszi, hogy a teljes valsznsgi eloszlst kisebb, feltteles valsznsgi eloszlsok
428
Created by XMLmind XSL-FO Converter.
Bizonytalansg
szorzataknt rhassuk fel. A naiv Bayes- (naive Bayes) modell adott okvltoz mellett felttelezi az okozati
vltozk feltteles fggetlensgt, a modell mrete pedig az okozati vltozk szmval linerisan n.
A wumpus vilg gense ki tudja szmtani a vilg meg nem figyelt esemnyeinek valsznsgt is, s azokat
hasznlva jobb kvetkeztetsekre tud jutni, mint egy egyszer logikai gens.
Bizonytalansg
8.2. Feladatok
13.1.
Mutassa meg az alapelvek segtsgvel, hogy
P(a b a) = 1
13.2.
A valsznsg-szmts aximit hasznlva bizonytsa be, hogy diszkrt vletlen vltozk tetszleges
valsznsgi eloszlsa sszegnek 1-et kell adnia.
13.3.
sszer lehet-e egy gens szmra a kvetkez hrom meggyzdsben hinni: P(A) = 0,4, P(B) = 0,3 s P(A
B) = 0,5? Ha igen, milyen valsznsgsvot tart sszernek A B-re vonatkozan? Ksztsen a 13.2. brhoz
hasonl tblzatot, s mutassa meg, hogyan tmasztja ez al az n rvelst. Ezutn ksztsen egy msik
vltozatot, amelynl P(A B) = 0,7. Magyarzza el, mirt racionlis egy ekkora valsznsg hozzrendelse,
mindamellett hogy a tblzat mutat egy olyan esetet, ami vesztesg, s hrom olyat, ami ki van egyenltve.
(Segtsg: milyen valsznsgi hozzrendels mellett ktelezte el magt az 1. gens a ngy esetben, de
klnsen a vesztesg esetn?)
13.4.
Ez a krds az 2.1. szakasz - lltsok rszben trgyaltaknak megfelelen, az elemi esemnyek tulajdonsgaival
foglalkozik.
a. Bizonytsa be, hogy az sszes lehetsges elemi esemny egyestse logikailag megegyezik az igaz lltssal.
(Segtsg: bizonytkknt alkalmazzon indukcit a vletlen vltozk szmra vonatkozan.)
430
Created by XMLmind XSL-FO Converter.
Bizonytalansg
b. Bizonytsa be, hogy brmely llts logikailag ekvivalens azon elemi esemnyek diszjunkcijval, amelyek
maguk utn vonjk annak igazsgt.
13.5.
Kpzeljk el a szokvnyos 52 lapos krtyacsomagbl osztott tlapos pker jtszmk tartomnyt, annak
feltevsvel, hogy az oszt becsletes.
a. Hny elemi esemnyt tartalmaz az egyttes valsznsg-eloszls (azaz hnyfle 5 lapos leoszts ltezik egy
kzben)?
b. Mekkora a valsznsge az egyes elemi esemnyeknek?
c. Mekkora a valsznsge a fell szos sznsornak (royal flush, egyszn sz, kirly, dma, bubi s tzes)? s
ngy egyforma lapnak?
13.6.
Szmtsa ki az albbiakat, ha adott a 13.3. bra szerinti teljes egyttes valsznsgi eloszls.
a. P(fogfjs)
b. P(Lyuk)
c. P(Fogfjs lyuk)
d. P(Lyuk fogfjs beakads)
13.7.
Mutassa meg, hogy a fggetlensg (13.8) egyenlet szerinti hrom felrsi mdja ekvivalens egymssal.
13.8.
Az venknt esedkes orvosi ellenrzse utn a doktor rossz s j hreket mond. A rossz hr az, hogy komoly
betegsget mutattak ki nnl, s a teszt 99%-ban megbzhat (azaz, annak a valsznsge, hogy a teszt
kimutatja a meglev betegsget, 0,99, s ugyangy, annak a valsznsge, hogy a teszt negatv lesz,
amennyiben nem ll fenn a betegsg, szintn 0,99). A j hr az, hogy ez a betegsg nagyon ritka, amelyet az n
korban minden 10 000 emberbl csak egy kap meg. Mirt j hr az, hogy a betegsg ritka? Mekkora az eslye
annak, hogy n tnyleg beteg?
13.9.
Sokszor clszerbb adott lltsok hatst bizonyos rgztettnek felttelezett ltalnos httrtnyek
felttelezsvel vgiggondolni, mint az informci teljes hinyban. Az albbi krdsek a szorzatszably s a
Bayes-ttel ltalnos alakjainak bizonytst clozzk, valamely e httrtny felttelezse mellett.
a. Bizonytsa be az ltalnos szorzatszably valamely felttel fennllsa esetn felrhat alakjt:
P(X, Y e) = P(X Y, e)P(Y e)
b. Bizonytsa be a Bayes-ttel (13.10) egyenlet szerinti, valamilyen felttel fennllsa esetre felrt vltozatt.
13.10.
Mutassa meg, hogy a
P(A,B C) = P(A C) P(B C)
13.11.
431
Created by XMLmind XSL-FO Converter.
Bizonytalansg
Tegyk fel, hogy kapott egy n darab egyforma pnzrmt tartalmaz zskot. Azt is tudjuk, a pnzek kzl n1
szablyos, azaz egyik oldaln fej, a msikon rs tallhat, ugyanakkor van egy darab hamis, amelynek mindkt
oldala fej.
a. Tegyk fel, hogy benyl a zskba, majd vletlenszeren kiemel egy pnzdarabot. Ezt feldobva fejet kap
eredmnyl. Mekkora a (feltteles) valsznsge annak, hogy a kivett pnzdarab a hamis?
b. Tegyk fel, hogy k-szor folytatva a pnz feldobst, ezutn is minden alkalommal fejet kap. Most mennyi
lesz a feltteles valsznsge annak, hogy a kivett pnzdarab a hamis?
c. Tegyk fel, hogy a k-szori feldobssal akarta eldnteni, hogy a hamis vagy egy j pnzrmt emelt ki a
zskbl. A dntsi eljrs HAMIS-at ad, ha mind a k feldobs alkalmval a fej van fll, egybknt pedig
J-t. Mekkora annak a (felttel nlkli) valsznsge, hogy az eljrs tvedni fog?
13.12.
Ebben a feladatban befejezheti az agyhrtyagyulladsra vonatkoz plda normalizlst. Elszr is vegyen fel
egy megfelel rtket P(S M)-re, s ennek segtsgvel szmtsa ki P(M S) s P(M S) normalizlatlan
rtkeit (azaz ne vegye figyelembe P(S)-t a Bayes-ttel kifejezsben), majd normalizlja az rtkeket gy, hogy
sszegk 1 legyen.
13.13.
Ez a feladat azt vizsglja, hogy a feltteles fggetlensg fennllsa hogyan befolysolja a valsznsgi
becslsekhez szksges informci mennyisgt.
a. Tegyk fel, hogy P(h e1,e2)-t szeretnnk kiszmtani gy, hogy nincs feltteles fggetlensgre vonatkoz
informcink. Az albbiak kzl melyik az az adathalmaz, amelyikre a szmtsokhoz szksgnk van?
i. P(E , E ), P(H), P(E H), P(E H)
1
d. Tegyk fel, hogy tudjuk, hogy P(E1 H, E2) = P(E1 H), H, E1, E2 minden rtkre. Hogyan vltozik az elbbi
krdsre adott vlasz?
13.14.
X, Y s Z legyenek logikai vletlen vltozk. A P(X, Y, Z) egyttes eloszls nyolc lehetsges esett jelljk a,
, h-val. Fejezze ki az X s Y adott Z mellett felttelesen fggetlenek lltst az a, , h-t sszekapcsol
egyenletek segtsgvel. Hny lesz ezek kzl redundanciamentes?
13.15.
(A (Pearl, 1988)-bl tvve.) Kpzeljk el, hogy n egy jszakai taxis cserbenhagysos baleset tanja
Athnban. Athnban minden taxi kk vagy zld. n azt vallja esk alatt, hogy a taxi kk volt. Egy szles kr
vizsglat azt mutatja, hogy ilyen gyenge fnyben a kk s zld szn kztti tveszts valsznsge 75%.
Kiszmthat-e, hogy milyen szn taxi volt a legvalsznbb? (Segtsg: gondosan klnbztessk meg azt az
lltst, hogy a taxi kk, s azt, hogy a taxi kknek tnik.)
Mi van akkor, ha minden 10 athni taxibl 9 zld?
13.16.
(A (Pearl, 1988)-bl tvve.) Hrom fegyenc, A, B s C cellikba vannak zrva. Kzismert, hogy egyikket
msnap ki fogjk vgezni, mg a msik kett kegyelmet kap. Azt, hogy kit vgeznek ki, csak a brtnigazgat
tudja. A fegyenc egy krssel fordul a brtnrhz: Legyen szves, krdezze meg az igazgattl, hogy kit
fognak holnap kivgezni, s a bartaim kzl az egyiknek, B-nek vagy C-nek rulja el, hogy reggel kegyelmet
fog kapni. Az r beleegyezik, majd ksbb azzal jn vissza, hogy B-nek szlt a kegyelemrl.
432
Created by XMLmind XSL-FO Converter.
Bizonytalansg
Mekkork A eslyei a kivgzsre a trtntek utn? (Ne csak erteljes kzlegyintssel, hanem matematikailag
megalapozottan vlaszoljon.)
13.17.
rja meg azt az ltalnos, naiv Bayes-eloszlst hasznl algoritmust, amely alkalmas P(Ok e) alak keressek
megvlaszolsra. Fel kell tteleznie azt is, hogy az e bizonytk az rintett vltozk tetszleges rszhalmazhoz
rendel rtkeket.
13.18.
A szvegosztlyozs olyan feladat, amely egy adott dokumentumot a benne lev szveg alapjn elre
rgztett kategrik valamelyikbe sorol be. Erre gyakran hasznlnak naiv Bayes-modellt. Ezekben a
modellekben a lekrdezs vltozja a dokumentumkategria s az okozati vltozk a nyelv egyes szavainak
meglte vagy hinya. Felttelezzk azt is, hogy a szavak egymstl fggetlenl, a dokumentumkategrira
jellemz srsggel jelennek meg a szvegekben.
a. Magyarzza el pontosan, hogyan lehet egy ilyen modellt ltrehozni, ha tant mintaknt adott egy, mr
osztlyozott dokumentumhalmaz.
b. Magyarzza el pontosan, hogyan trtnik egy j dokumentum besorolsa.
c. Elfogadhat-e a fggetlensg felttelezse? Rszletezze.
13.19.
A wumpus vilg vizsglatnl abbl a tnybl indultunk ki, hogy a ngyzetek a tbbi ngyzet tartalmtl
fggetlenl 0,2 valsznsggel tartalmaznak csapdt. Ehelyett most tegyk fel, hogy az [1, 1]-en kvli N
ngyzetben pontosan N/5 csapda van egyenletes eloszlsban vletlenszeren elhelyezve. Fggetlenek-e tovbbra
is a Ci,j s a Ck,l vltozk? Hogyan fog most kinzni a P(C1,1, , C4,4) egyttes eloszls? Szmolja jra az [1, 3]
s a [2, 2] ngyzetekben tallhat csapda valsznsgt.
433
Created by XMLmind XSL-FO Converter.
Az angol nyelv szakirodalomban a Bayes-hl a legelterjedtebb megnevezs, de szmos ms is ltezik: bizonyossghl (belief
network), valsznsgi hl (probabilistic network), okozati hl (causal network), tudshl (knowledge map). A statisztikban a
grfos modell (graphical model) bvebb modellosztlyt jelent, ami a Bayes-hlt is magban foglalja. A Bayes-hlk egy kiterjesztsnek
neve a dntsi hl (decision network) vagy hatsdiagram (influence diagram) lsd 16. fejezet.
1
434
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
Idzzk fel a 13. fejezetben lert egyszer vilgot, amely a Fogfjs, a Lyuk, a Beakads s az Idjrs vltozt
tartalmazza. gy rveltnk, hogy az Idjrs fggetlen az sszes tbbi vltoztl; tovbb, hogy a Fogfjs s a
Beakads felttelesen fggetlenek a Lyuk ismeretben. Ezeket a viszonyokat a 14.1. brn bemutatott Bayeshl reprezentlja. Formlisan, a Fogfjs s a Beakads feltteles fggetlensgt a Lyuk ismeretben a
Fogfjs s a Beakads kztti nyl hinya jelzi. Szemlletesen, a hl azt a tnyt fejezi ki, hogy a Lyuk
kzvetlen oka a Fogfjs-nak s a Beakads-nak, tovbbi kzvetlen okozati kapcsolat azonban nem ltezik a
Fogfjs s a Beakads kztt.
14.1. bra - Egy egyszer Bayes-hl, amelyben az Idjrs fggetlen a tbbi hrom
vltoztl, a Fogfjs s a Beakads pedig felttelesen fggetlenek a Lyuk ismeretben
Most vizsgljuk meg a kzvetkez pldt, ami csak egy rnyalatnyival szetettebb. Otthonunkban egy j
betrsjelzt szereltek fel. Ez megbzhatan szleli a betrseket, de idnknt kisebb fldrengsek esetn is
jelez. (Ez a plda Judea Pearltl szrmazik, aki Los Angeles-i lakos; innen ered a fldrengsek irnti klns
rdekldse.)2 Kt szomszdunk is van, Jnos s Mria, akik meggrtk, hogy felhvnak a munkahelynkn, ha
meghalljk a riasztnkat. Jnos mindig felhv minket, ha meghallja a riasztst, de nha sszekeveri a
telefoncsrgst a riaszt csengsvel, s ekkor is telefonl. Mria viszont, mivel szereti hangosan hallgatni a
zent, nha meg sem hallja a riasztt. Mi teht a hvsok bekvetkezte vagy hinya alapjn szeretnnk
megbecslni a betrs valsznsgt. Ezt az egyszer problmt a 14.2. brn lthat Bayes-hl rja le.
Judea Pearl meghatroz szerepet jtszott a Bayes-hlk egzakt matematikai htternek s gyakorlati alkalmazhatsgnak a vizsglatban.
(A ford.)
2
435
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
2. A Bayes-hlk szemantikja
Az elz alfejezetben bemutattuk a hlt, de annak jelentst nem. A Bayes-hlk szemantikjt ktfle mdon
lehet megrteni. Az els szerint a hl az egyttes valsznsg-eloszls fggvny egy lersa. A msodik
szerint a hl feltteles fggetlensgekrl szl lltsok egyttest rja le. A kt szemllet ekvivalens, de az
els inkbb abban segt, hogyan hozzunk ltre egy hlt, mg a msodik a kvetkeztetsi eljrsok tervezst
segti.
ahol a szlk(Xi) a Szlk(Xi)-ben szerepl vltozk adott rtkeinek egyttest jelli. gy az egyttes
valsznsg-eloszls fggvnyt ler tblzat minden bejegyzse a Bayes-hlban szerepl, feltteles
valsznsgi tblk (FVT) megfelel elemeinek a szorzata. Ezzel az FVT-k valjban az egyttes
valsznsg-eloszls fggvny dekomponlt lerst adjk meg. Ennek illusztrlsra kiszmtjuk annak az
esemnynek a valsznsgt, hogy a riaszt megszlal, de nem volt sem betrs, sem fldrengs, azonban
Jnos s Mria is telefonl. A kezdbetkkel jellve a vltozkat:
3
A diszkrt vltozkra utal szhasznlat ellenre az lltsok analgjai folytonos vltozk esetn is fennllnak. (A ford.)
436
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
P(j m a b e)
= P(j a)P(m a)P(a b e)P(b)P(e)
= 0,90 0,70 0,001 0,999 0,998 = 0,00062
Majd ismtelten alkalmazzuk ezt a lpst, minden egyes egyttes valsznsget felbontva egy feltteles
valsznsgre s egy kisebb egyttes valsznsgre. Vgezetl egyetlen hossz szorzatot kapunk:
Ez a lncszablyknt (chain rule) ismert azonossg valsznsgi vltozk brmely halmazra fennll.
sszehasonltva ezt a (14.1.) egyenlettel lthatjuk, hogy az egyttes valsznsg-eloszls fggvny megadsa
ekvivalens azzal az ltalnos lltssal, hogy a hl minden Xi vltozjra
P(Xi|Xi1, , X1) = P(Xi|Szlk(Xi)) (14.2)
feltve, hogy Szlk(Xi) {Xi1, , X1}. Ez utbbi felttel a csompontok brmely olyan sorszmozsval
teljesthet, ami konzisztens a grf struktrjbl add implicit rszleges rendezssel.
Fontos
A (14.2) egyenlet szerint, egy Bayes-hl csak abban az esetben lehet helyes reprezentcija a
trgytartomnynak, ha az adott szlk mellett, minden csompont felttelesen fggetlen a csompontot
sorrendezsben t megelzktl. gy a trgytartomny struktrjnak megfelel Bayes-hl megptse
sorn, minden egyes csomponthoz gy kell a szlket megvlasztanunk, hogy ez a felttel teljesljn.
Szemlletesen ez azt jelenti, hogy az Xi csompont szlei halmaznak tartalmaznia kell az {X1, , Xi1}
kzl mindazokat a csompontokat, amelyek kzvetlenl befolysoljk Xi-t. Pldul ttelezzk fel,
hogy a 14.2. brn lthat hlt mr teljesen befejeztk, csupn a MriaTelefonl szleit kell mg
megvlasztanunk. A MriaTelefonl-t egyrtelmen befolysolja, hogy trtnt-e Betrs vagy
Fldrengs, de nem kzvetlenl. A helyzettel kapcsolatos ismereteink alapjn tudhatjuk, hogy ezek az
esemnyek csak a riaszt ltal befolysolhatjk Mria telefonlssal kapcsolatos viselkedst.
Hasonlan, ha a riaszt llapota ismert, akkor Jnos hvsnak bekvetkezte vagy elmaradsa mr
nincs hatssal Mria telefonlsra. Formlisan fogalmazva, gy vljk, hogy a kvetkez feltteles
fggetlensg teljesl:
P(MriaTelefonl|JnosTelefonl, Riaszts, Fldrengs, Betrs)
= P(MriaTelefonl|Riaszts)
437
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
Amellett hogy egy teljes s nem redundns reprezentcija a trgytartomnynak, egy Bayes-hl gyakran sokkal
tmrebb, mint az egyttes valsznsg-eloszls fggvny. Ez a tulajdonsga teszi hasznlhatv a sokvltozs
trgyterletek kezelsben. A Bayes-hl tmrsge a loklisan strukturlt (locally structured) (vagy ritka
sparse) rendszerek egy igen ltalnos tulajdonsgnak pldja. Egy loklisan strukturlt rendszerben egy
komponens csak korltos szm ms komponenssel van kapcsolatban kzvetlenl, fggetlenl a komponensek
teljes szmtl. Loklis struktrkhoz ltalban inkbb a lineris, mint az exponencilis komplexitsnvekeds
kapcsolhat. A Bayes-hl esetben jogos azt felttelezni, hogy a legtbb trgytartomny esetn egy
valsznsgi vltozt csak k szm ms vltoz befolysol, ahol k konstans. Ha binris vltozkat tteleznk
fel az egyszersg kedvrt, akkor az egy csomponthoz tartoz feltteles valsznsgi tbla megadshoz
legfeljebb 2k rtk szksges, gy a teljes hl n2k rtkkel megadhat. Ezzel szemben az egyttes valsznsgeloszls fggvny 2n rtket tartalmaz. Egy konkrt pldval lve, ha 30 csompontunk van (n = 30), s
mindegyiknek legfeljebb 5 szlje van (k = 5), akkor a Bayes-hl 960 szmot ignyel, mg az egyttes
valsznsg-eloszls fggvny tbb mint egy millirdot.
Lteznek olyan trgytartomnyok, ahol a vltozk mindegyikt kzvetlenl befolysolhatja az sszes tbbi, gy
a hl teljesen sszekttt. A feltteles valsznsgi tblk megadsa ekkor ugyanakkora mennyisg
informcit ignyel, mint az egyttes valsznsg-eloszls fggvny megadsa. Bizonyos trgytartomnyokban
lteznek olyan gyenge fggsgek, amiket felttlenl modellezni kell egy j kapcsolat felvtelvel. De ha ezek a
fggsgek igen gyengk, akkor lehet, hogy nem ri meg a hl komplexitst megnvelni a pontossg
kismrtk nvelsnek rdekben. Pldul a betrses hlnkkal kapcsolatban kifogsolhat az, hogyha
fldrengs van, akkor Mria s Jnos akkor sem telefonlna, ha hallank a riasztt, mivel felttelezik, hogy a
fldrengs okozta. Az, hogy hozzkapcsoljuk-e a Fldrengs-t a MriaTelefonl-hoz s a JnosTelefonl-hoz
(s gy megnveljk a tblkat) azon mlik, hogy mennyire fontos pontosabb valsznsgeket kapni, s
mennyire kltsges meghatrozni az extra informcit.
Fontos
Azonban mg egy loklisan strukturlt problmnl sem egyszer loklisan strukturlt Bayes-hlt
felpteni. Ugyanis nemcsak azt kveteljk meg, hogy minden egyes vltozt csak nhny msik
befolysoljon kzvetlenl, hanem azt is, hogy a hl topolgija valban mutassa azokat a kzvetlen
hatsokat a szlk megfelel megvlasztsval. A konstrukcis eljrsunk mkdse miatt elbb a
kzvetlen befolysolkat kell a hlhoz adni, ha azt szeretnnk, hogy szlknek tudjuk ket
vlasztani az ltaluk befolysolt csompontnl. Ezrt a helyes sorrend a csompontok hozzadsnl
az, hogy elszr az alapvet okokat adjuk a hlhoz, majd a vltozkat, amelyeket befolysolnak, s
ezt addig folytatjuk, amg el nem rjk a leveleket, amelyeknek mr nincs kzvetlen okozati hatsa
ms vltozkra.
Mi trtnik, ha trtnetesen rossz sorrendet vlasztunk? Vizsgljuk meg jra a betrses pldt. Ttelezzk fel,
hogy a vltozkat a kvetkez sorrendben adjuk a hlhoz: MriaTelefonl, JnosTelefonl, Riaszts, Betrs,
Fldrengs. Ekkor egy kicsit bonyolultabb hlt kapunk (14.3. (a) brn). Az eljrs a kvetkez:
MriaTelefonl hozzadsa: szlk nincsenek.
JnosTelefonl hozzadsa: ha Mria telefonl, az valsznleg azt jelenti, hogy a riaszt megszlalt, ami
termszetesen valsznbb teszi, hogy Jnos telefonljon. gy a JnosTelefonl-nak szksgszeren szlje a
MriaTelefonl.
438
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
Riaszts hozzadsa: nyilvnval, ha mindketten telefonlnak, akkor valsznbb, hogy a riaszt megszlalt,
mintha csak egyikk, vagy egyikk sem. gy mind a JnosTelefonl, mind a MriaTelefonl szksges mint
szl.
Betrs hozzadsa: ha ismerjk a riaszt llapott, akkor a Jnostl vagy Mritl jv telefonhvsok lte
vagy hinya csupn azt jelezhetik, hogy cseng-e a telefonunk, vagy hogy Mria zenje hangosra van-e lltva,
de a betrsrl nem nyjtanak tovbbi informcit. Azaz
P(Betrs Riaszts, JnosTelefonl, MriaTelefonl) = P(Betrs Riaszts)
Fontos
A kiadd hlnak kettvel tbb le van, mint az eredetinek a 14.2. brn, s hrommal tbb
valsznsg meghatrozst ignyli. Ami mg rosszabb, hogy nhny kapcsolds megfoghatatlan
viszonyt reprezentl, ami nehz s nem termszetes valsznsgi tleteket ignyel, pldul a
Fldrengs feltteles valsznsgnek a megbecslst, a Betrs s a Riaszts felttelekkel. Ez a
jelensg igen ltalnos, s kapcsoldik az okozati s diagnosztikai modelleknek a 8. fejezetben
bevezetett megklnbztetshez. Ha gy prblunk meg egy diagnosztikai modellt megpteni, hogy
a kapcsolatok okozat-ok irnyak (mint pldul a MriaTelefonl-tl a Riaszts-ig vagy a Riaszts-tl
a Betrs-ig kapcsolat), akkor vgl egybknt fggetlen okok kztt kell fggst meghatroznunk (s
gyakran a klnllan bekvetkez okozatok kztt is). Ha ragaszkodunk az okozati modellhez, akkor
kevesebb rtket kell megadnunk, s az rtkeket ltalban knnyebb meghatrozni. Orvosi
trgytartomnyon pldul Tversky s Kahneman demonstrlta, hogy orvos szakrtk szvesebben
hoznak valsznsgi tleteket okozati, mint diagnosztikai sszefggsek esetn (Tversky s
Kahneman, 1982).
A 14.3. (b) bra a vltozk igazn szerencstlen sorrendjt mutatja: MriaTelefonl, JnosTelefonl,
Fldrengs, Betrs, Riaszts. Ez a hl 31 nll valsznsg meghatrozst ignyli pontosan annyit,
amennyi a teljes egyttes valsznsg-eloszls fggvny megadsa. Azonban fontos felismerni, hogy a hrom
hl brmelyike kpes pontosan ugyanannak az egyttes valsznsg-eloszls fggvnynek a reprezentlsra.
A kt utbbi egyszeren csak nem reprezentlja az sszes feltteles fggetlensgi relcit, s gy rengeteg
szksgtelen rtk meghatrozsra knyszerl.
439
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
Ltezik egy tovbbi ltalnos topolgiai kritrium a d-elvlaszts (d-separation) annak eldntsre, hogy a csompontok egy X halmaza
fggetlen-e egy msik Y halmaztl egy harmadik Z halmaz felttel esetn. A kritrium elg bonyolult, s nem szksges a fejezetben az
algoritmusok szrmaztatsnl, ezrt nem trgyaljuk. A rszletek megtallhatk Russell s Norvig, valamint Pearl munkiban (Russell s
Norvig, 1995; Pearl, 1988). Shachter egy sokkal szemlletesebb mdszert ad a d-elvlasztsok meghatrozshoz (Shachter, 1998).
4
440
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
amelyek valamilyen szabvnyos mintt kvetnek. Ilyen esetekben a teljes tbla megadhat a mintzat s esetleg
nhny paramter meghatrozsval sokkal knnyebben, mint exponencilis szm paramter megadsval.
A legegyszerbb pldt a determinisztikus csompontok (deterministic nodes) szolgltatjk. Egy
determinisztikus csompont rtkt a szleinek az rtke teljesen meghatrozza, mindenfajta bizonytalansgtl
mentesen. A relci lehet egy logikai kapcsolat pldul ha a szlcsompontok azt jelentik, hogy Kanadai,
Egyeslt llamokbeli s Mexiki, a gyermekcsompont pedig azt, hogy szak-Amerikai, akkor a kzttk lv
kapcsolat egyszeren a szlk diszjunkcija. A relci lehet numerikus is pldul ha a szlcsompontok egy
gpkocsi klnbz rai klnbz forgalmazknl, a gyermekcsompont pedig az az r, amit egy legolcsbbat
keres vev vgezetl fizetne, akkor a gyermekcsompont rtke a szlk rtkeinek a minimuma. Msik plda,
ha a szlcsompontok az egy tba bejv vzmennyisgek (folyk, vzlevezetk, csapadk) s az onnan
eltvoz vzmennyisgek (folyk, prolgs, elszivrgs), a gyermek pedig a t szintjnek a megvltozsa, akkor
a gyermek rtke a kifoly s befoly szlk rtkeinek a klnbsge.
Bizonytalan relcikat gyakran jellemezhetnk gynevezett zajos logikai relcikkal. A mintaplda erre az
gynevezett zajos-VAGY (noisy-OR) relci, ami a logikai VAGY relci ltalnostsa. tletlogikban
kijelenthetjk, hogy a Lz akkor s csak akkor igaz, ha a Megfzs vagy az Influenza vagy a Malria igaz. A
zajos-VAGY modell megenged bizonytalansgot, hogy egyes szlk okozhatjk-e a gyermekek igaz rtkt
az okozati kapcsolat a szl s gyermek kztt gtolt lehet, s gy lehet, hogy a pciens meg van fzva, de nincs
lza. A modell kt feltevsre pl. Elsknt felttelezi, hogy az sszes lehetsges ok fel van sorolva. (Ez nem
annyira szigor megkts, mint amilyennek tnik, mivel mindig ltrehozhatunk egy gynevezett
szivrgscsompontot (leak node), ami vegyes okokat fed le.) Msodikknt felteszi, hogy brmely szl
gtlsa fggetlen a tbbi szl gtlstl: pldul akrmi is gtolja, hogy a Malria lzat okozzon, ez fggetlen
attl, hogy mi gtolja az Influenz-t, hogy lzat okozzon. Ezekkel a feltevsekkel a Lz akkor s csak akkor
hamis, ha az sszes igaz rtk szl gtolt, aminek a valsznsge a gtls-valsznsgek szorzata.
Ttelezzk fel, hogy ezek az nll gtlsi valsznsgek a kvetkezk:
P(lz megfzs, influenza, malria) = 0,6
P(lz megfzs, influenza, malria) = 0,2l
P(lz megfzs, influenza, malria) = 0,1
Ekkor ennyi informcibl s a zajos-VAGY feltevsbl a teljes FVT-t fel lehet pteni. A kvetkez
tblzat azt mutatja, hogy hogyan:
ltalnossgban, a zajos logikai relcik, amelyekben egy vltoz k szm szltl fgg, O(k) paramterrel
rhatk le, a teljes feltteles valsznsg-eloszls tblzathoz tartoz O(2k) helyett. Ez sokkal knnyebb teszi a
becslst s a tanulst. Pldul a CPSC-hl (Pradhan s trsai, 1994) zajos-VAGY- s zajos-MAX-eloszlsokat
hasznl a betegsgek s tnetek kztti kapcsolatok modellezsre. 448 csompont s 906 l esetn ez csak
8254 rtket ignyel a 133 931 430 helyett, ami egy teljes FVT-ket hasznl hl esetn lenne szksges.
Valsznsgi kvetkeztets
folytonos. Definci szerint, a folytonos vltozknak vgtelen szm rtke lehet, gy lehetetlen feltteles
valsznsgeket megadni minden egyes rtkre. Egy lehetsges mdszer a folytonos vltozk kezelsre, ha
elkerljk ket diszkretizlssal (discretization) azaz felosztjuk a lehetsges rtkeket intervallumok adott
halmaza szerint. Pldul, a hmrskletet feloszthatjuk (<0C), (0C100C) s (>100C) intervallumokra. A
diszkretizls nha adekvt megolds, de gyakran eredmnyezi a pontossg jelents romlst, valamint nagyon
nagy FVT-ket. Egy msik megolds, ha a valsznsg srsgfggvnyek alapvet csaldjaibl vlasztunk
(lsd A) fggelk), amelyek vges szm paramterrel megadhatk. Pldul, a Gauss- (vagy norml)
eloszlshoz N(, 2)(x) a tlag s 2 szrsngyzet tartozik mint paramterek.
Egy diszkrt s folytonos vltozkat is tartalmaz hlt hibrid Bayes-hlnak (hybrid Bayesian network)
neveznk. Egy hibrid hl megadshoz kt jfajta eloszlst kell megadnunk: feltteles eloszlst folytonos
vltozhoz diszkrt s/vagy folytonos szlk esetn; tovbb feltteles eloszlst diszkrt vltozkhoz folytonos
szlk esetn. Fontoljuk meg a 14.5. bra egyszer pldjt, amelyben a vsrl valamilyen gymlcst vsrol
az ra fggvnyben, ami viszont a terms mennyisgtl fgg s attl, hogy ppen van-e llami tmogats. Az
r vltoz folytonos, a szlei pedig folytonosak s diszkrtek; a Vsrol vltoz diszkrt, s van egy folytonos
szlje.
Az r vltozhoz meg kell adnunk a P(r Terms, Tmogats) eloszlst. A diszkrt szlt explicit
felsorolssal kezeljk azaz megadjuk mind a P(r Terms, tmogats), mind a P(r Terms, tmogats)
valsznsgeket. A Terms kezelshez megadjuk, hogy a c r feletti eloszlsa hogyan fgg a t Terms
folytonos rtktl. Mshogy fogalmazva, az r eloszlsnak a paramtereit a terms t rtknek fggvnyben
adjuk meg.
442
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
Ebben a pldban ekkor, az r feltteles eloszlst a lineris normlis eloszls kivlasztsval s az ai, bi, i, ah,
bh s h paramterekkel adhatjuk meg. A 14.6. (a) s (b) bra mutatjk ezt a kt kapcsolatot. Figyeljk meg, hogy
mindegyik esetben a meredeksg negatv, mivel az r cskken a knlat nvekedsvel. (Termszetesen a
linearits feltevse azt is jelenti, hogy az r egy bizonyos pontnl negatv lesz; a lineris modell csak akkor
sszer, ha a terms mennyisgt egy szk tartomnyra korltozzuk.) A 14.6. (c) bra a P(c|t) eloszlst mutatja,
tlagolva a Tmogats kt lehetsges rtke felett felttelezve, hogy mindegyik a priori valsznsge 0,5. Ez
mutatja, hogy mg igen egyszer modellekkel is, elg rdekes eloszlsok reprezentlhatk.
A lineris normlis feltteles eloszlsnak vannak bizonyos specilis tulajdonsgai. Egy csak folytonos, lineris
normlis feltteles eloszls vltozkat tartalmaz hl egyttes eloszlsa egy tbbvltozs normlis eloszls az
sszes vltoz felett (lsd 14.5. feladat).5 [A tbbvltozs normlis eloszls egy fellet tbb mint egy
dimenziban, aminek van egy cscsa az tlagnl (n dimenziban), rtke pedig ettl tvolodva minden irnyban
cskken.] Ha diszkrt vltozkat adunk a hlhoz (feltve, hogy egyetlen diszkrt vltoz sem gyermeke egy
folytonos vltoznak), a hl egy feltteles Gauss- (conditional Gaussian) vagy FG-eloszlst definil:
brmilyen rtket is rendelnk a diszkrt vltozkhoz, a folytonos vltozk feletti eloszls egy tbbvltozs
Gauss-eloszls lesz.
Most a folytonos szlvel rendelkez diszkrt vltozk eloszlsval kezdnk foglalkozni. Fontoljuk meg
pldul a Vsrol csompontot a 14.5. brn. sszernek tnik azt felttelezni, hogy a vsrl vsrol, ha az r
alacsony, nem vsrol, ha magas, a vsrls valsznsge pedig folytonosan vltozik egy kzbens rgiban.
Mshogy fogalmazva, a feltteles eloszls hasonl egy elmosdott (soft) kszbfggvnyhez. Az
elmosdott kszbk ltrehozsra egy mdszer a standard normlis eloszls integrljnak a hasznlata:
ami azt jelenti, hogy az r kszbe krl van, s a kszbrgi szlessge arnyos -val, illetve, hogy a
vsrls valsznsge cskken, ahogy az r nvekszik.
Kvetkezskppen lineris normlis hlkban a kvetkeztets idignye legrosszabb esetben is csak O(n3), fggetlenl a hl
topolgijtl. A 14.4. alfejezetben ltni fogjuk, hogy diszkrt vltozs hlban a kvetkeztets NP-nehz.
5
443
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
Ezt a probit eloszlst (probit distribution) a 14.7. (a) bra illusztrlja. Alakja azzal az rvelssel igazolhat,
hogy az alapul szolgl dntsi folyamatnl ltezik egy pontos kszb, de ennek pontos helyt egy vletlen
normlis eloszls zaj befolysolja. A probit modell egy alternatvja a logit eloszls (logit distribution), amely
a szigmoid fggvnyt (sigmoid function) hasznlja egy elmosdott kszb ellltshoz:
Ezt a 14.7. (b) bra mutatja. A kt eloszls hasonlan nz ki, de valjban a logit sokkal lassabban tart a
hatrrtkekhez. A probit gyakran jobban illeszkedik a valdi helyzetekhez, de a logit esetenknt
matematikailag knnyebben kezelhet, pldul szles krben hasznlatos a neurlis hlkban (lsd 20. fejezet).
Mind a probit, mind a logit ltalnosthat tbb folytonos szlre a szlk rtkeinek lineris kombincijt
vve. Tbbrtk diszkrt gyermekre trtn kiterjesztseket a 14.6. feladatban taglalunk.
Feltesszk, hogy a clvltoz nincs a bizonytkvltozk kztt; amgy X a posteriori eloszlsa a megfigyelt rtkre 1 valsznsget ad.
Az egyszersg kedvrt azt is feltettk, hogy a krds egyetlen vltozra irnyul. Az algoritmusaink knnyen kiterjeszthetk tbb vltoz
egyttesnek lekrdezsre.
6
444
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
A 13. fejezet elmagyarzta, hogy brmely feltteles valsznsg kiszmthat a teljes egyttes eloszls
tagjainak sszegzsvel. Pontosabban, egy P(X e) lekrdezs megvlaszolhat a (13.6) egyenlet
felhasznlsval, amit a jobb kvethetsg kedvrt itt megismtlnk:
Fontos
Tovbb, mint ismeretes, a Bayes-hl a teljes egyttes eloszls egy teljes reprezentcijt nyjtja.
Mg pontosabban, a (14.1) egyenlet azt mutatja, hogy az egyttes eloszls P(x, e, y) tagjai felrhatk a
hlbl szrmaz feltteles valsznsgek szorzataiknt. Ezrt egy lekrdezs megvlaszolhat a
Bayes-hl felhasznlsval, kiszmtva a hlbl szrmaz feltteles valsznsgek szorzatainak az
sszegt.
A 13.4. brn a FELSOROL-EGYTTES-KRDEZS algoritmust adtuk meg a teljes egyttes eloszlsbl
felsorolssal trtn kvetkeztetsre. Az algoritmus bemenetknt fogadja a P teljes egyttes eloszlst, s
rtkeket nz meg benne. Egyszer mdostssal elrhet, hogy az algoritmus egy bn Bayes-hlt fogad
bemenetknt, s az egyttes bejegyzseket a bn megfelel FVT-bejegyzseinek sszeszorzsval nzi meg.
Vegyk a P(Betrs JnosTelefonl = igaz, MriaTelefonl = igaz) lekrdezst. A rejtett vltozk ennl a
krdsnl a Fldrengs s a Riaszts. A (13.6) egyenletbl, a kifejezsek rvidtse miatt a kezdbetket
hasznlva, azt kapjuk, hogy7
A Bayes-hlk szemantikja (14.1) egyenlet pedig az FVT-bejegyzsek felhasznlsval egy kifejezst ad.
Az egyszersg kedvrt ezt csak a Betrs = igaz esetre adjuk meg:
Ennek a kifejezsnek a kiszmtshoz ngy tagot kell sszeadnunk, amelyek mindegyikt t szm
sszeszorzsval kapjuk. Legrosszabb esetben, amikor majdnem minden vltoz felett sszegezni kell, az
algoritmus komplexitsa egy n binris vltozs hl esetn O(n2n).
A kvetkez egyszer megfigyelssel egy javtshoz juthatunk: a P(b) tag lland, s ki lehet vinni az a s e
feletti sszegzsek el, a P(e) tag pedig kivihet az a feletti sszegzs el. gy azt kapjuk, hogy
445
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
Ez a kifejezs egy ciklussal rtkelhet ki, sorban vgighaladva a vltozkon, mikzben sszeszorozzuk az
FVT-bejegyzseket. Minden sszegzsnl, a vltoz lehetsges rtkei szerint is iterlnunk kell. A szmts
struktrjt a 14.8. bra mutatja. Felhasznlva a 14.2. bra rtkeit, azt kapjuk hogy P(b j,m) =
0,00059224. A b-hez tartoz szmtst tfutva az 0,0014919-et eredmnyez; gy
Valsznsgi kvetkeztets
nyomaszt. Egy figyelemre mlt dolog a 14.8. bra fjval kapcsolatban, hogy nyilvnvalv teszi a
megismtelt alkifejezseket, amelyeket az algoritmus kirtkel. A P(j a) P(m a) s a P(j a) P(m a)
szorzatok ktszer kerlnek kiszmtsra, e minden rtknl. A kvetkez fejezet egy ltalnos mdszert r le,
ami elkerli az ilyen felesleges jraszmtsok elvgzst.
Vegyk szre, hogy a kifejezs minden rszt megjelltk a kapcsold vltoz nevvel; ezeket tnyezknek
(factors) nevezzk. A lpsek a kvetkezk:
Az M tnyez, P(m a) nem ignyel M feletti sszegzst (mivel M rtke mr rgztett). Eltroljuk a
valsznsget a minden rtkre egy ktelem vektorban,
Az itt hasznlt szorzst pontonknti szorzsnak (pointwise product) nevezik, s hamarosan ismertetjk.
Hasonl mdon dolgozzuk fel E-t: kisszegezzk E-t fE(E) s
szorzatbl:
Most pedig kiszmthatjuk az eredmnyt egyszeren sszeszorozva B tnyezjt (azaz fB(B) = P(B)-t) az
kiaddott mtrixszal:
A 14.7. (a) feladatban azt krjk, hogy ellenrizze, helyes eredmnyt ad-e ez a folyamat.
A lpsek sorozatt megvizsglva lthatjuk, hogy kt alapvet mvelet szksges: tnyezprok pontonknti
sszeszorzsa s egy vltoz kisszegzse tnyezk szorzatbl.
447
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
A pontonknti szorzs nem mtrixszorzs s nem is egy elemenknti szorzs. Kt, f1 s f2 tnyeznek a
pontonknti szorzata egy j f tnyezt eredmnyez, amelynek vltozit az f1 s f2 vltozinak az unija adja.
Ttelezzk fel, hogy a kt tnyezben az Y1, ..., Yk vltozk kzsek. Ekkor azt kapjuk, hogy
f(X1 Xj, Y1 Yk, Z1 Zl) = f1(X1 Xj, Y1 Yk)f2(Y1 Yk, Z1 Zl)
Ha minden vltoz binris, akkor f1-nek s f2-nek 2j+k s 2k+l eleme van, pontonknti szorzatuknak pedig 2j + k + l.
Pldul az f1(A,B) s az f2(B,C) tnyezk esetn a lentebb mutatott valsznsg-eloszlssal, az f1 f2
pontonknti szorzata f3(A, B, C)-vel adott:
Egy vltoz kisszegzse tnyezk szorzataibl szintn egyrtelm szmts. Az egyetlen szreveend trkk az,
hogy brmely tnyez, ami nem fgg a kisszegzend vltoztl, az az sszegzsen kvlre mozgathat.
Pldul:
Most a pontonknti szorzat kerl kiszmtsra az sszegzsen bell, a vltozt pedig kisszegezzk a kiadd
mtrixbl:
Vegyk szre, hogy mtrixokat nem szorzunk, ameddig nem kell kisszegeznnk egy vltozt a kiadd
szorzatbl. Annl a pontnl csak azokat a mtrixokat szorozzuk szsze, amelyek magukban foglaljk a
kisszegzend vltozt. A pontonknti szorzs s a kisszegzs eljrsok meglte esetn maga a vltoz
eliminls algoritmusa, amint azt a 14.10. bra mutatja, igen egyszeren felrhat.
Nzznk mg egy lekrdezst: P(JnosTelefonl Betrs = igaz). Szoksos mdon, az els lps az egymsba
gyazott sszegzsek felrsa:
Fontos
Ezt az eljrst folytatva vgl szksgszeren arra jutunk, hogy minden vltoz, ami nem se a
clvltoznak vagy egy bizonytkvltoznak, irrelevns a lekrdezsre. A vltoz eliminl algoritmus
ezrt az sszes ilyen vltozt eltvolthatja a lekrdezs kirtkelse eltt.
14.10. bra - A
megvlaszolsra
vltoz
eliminls
algoritmus
448
Created by XMLmind XSL-FO Converter.
Bayes-hls
lekrdezsek
Valsznsgi kvetkeztets
Fontos
A 14.2. bra betrs hlja a hlknak azon csaldjhoz tartozik, ahol a hl brmely kt csompontja
kztt legfeljebb egyetlen irnytatlan t ltezik. Ezeket egyszeresen sszekttt (singly connected)
hlknak vagy polifknak (polytree) nevezzk, amelyeknek van egy klnsen kellemes
tulajdonsguk: az egzakt kvetkeztets id- s trkomplexitsa a polifkban a hl mretben lineris.
Itt a mret az FVT-bejegyzsek szmval van definilva; ha minden egyes csompont szleinek a
szma egy konstanssal korltozott, akkor a komplexits a csompontok szmban is lineris. Ezek az
eredmnyek brmely a hl topolgiai sorrendjvel konzisztens sorrendezs esetn fennllnak (lsd
14.7. feladat).
Fontos
A tbbszrsen sszekttt (multiply connected) hlban (lsd pldul 14.11. (a) bra) a vltoz
eliminls legrosszabb esetben exponencilis id- s trkomplexits lehet, mg akkor is, ha a
csompontonknti szlk szma korltos. Ez nem meglep, figyelembe vve, hogy a Bayes-hlkban
val kvetkeztets NP-nehz, mivel ez specilis alesetknt tartalmazza az tletlogikai kvetkeztetst is.
Valjban megmutathat (lsd 14.8. feladat), hogy a problma ugyanannyira nehz, mint kiszmtani
egy tletlogikai formula esetn a formult kielgt rtkadsok szmt. Ez azt jelenti, hogy ez #Pnehz (szmossg-P-nehz), azaz szigoran nehezebb, mint az NP-teljes problmk.
Szoros kapcsolat ll fenn a Bayes-hlkban trtn kvetkeztets komplexitsa s a knyszerkielgtsi
problmk (CSP) komplexitsa kztt. Amint az 5. fejezetben trgyaltuk, egy diszkrt CSP megoldsnak
nehzsge ahhoz kapcsoldik, hogy a knyszergrf mennyire faszer. Olyan mrtkek, mint a
hiperfaszlessg (hypertree width), amelyek a CSP megoldsi komplexitst hatroljk, kzvetlenl
alkalmazhatk Bayes-hlknl is. Ezenfell a vltoz eliminls algoritmusa ltalnosthat gy, hogy
knyszerkielgtsi problmkat is s Bayes-hlkat is megoldjon.
Valsznsgi kvetkeztets
(cluster node) val sszevonsval, ahogy azt a 14.11. (b) bra mutatja. A kt binris csompontot egyetlen
megacsompont vltotta fel, ami ngy lehetsges rtket vesz fel: hh, hi, ih, ii. A megacsompontnak csak egy
szlje van, a binris Felhs vltoz, gy kt feltteles eset ltezik.
A hl polifv konvertlsa utn, egy specilis cl kvetkeztetsi algoritmust alkalmazunk. Alapveten az
algoritmus egyfajta knyszerterjeszts (lsd 5. fejezet), ahol a knyszerek biztostjk, hogy a szomszdos
csoportokban megegyeznek a kzs vltozk a posteriori eloszlsai. Gondos nyilvntartssal ez az algoritmus
kpes O(n) idben ahol n most a mdostott hl mrete kiszmolni a hl sszes nem bizonytk
csompontjnak a posteriori eloszlst. Azonban a problma NP-nehz volta nem tnt el: ha a hl
exponencilis id- s trigny a vltoz eliminls esetn, akkor a csoportostott hlhoz tartoz FVT-k
megkonstrulsa exponencilis id- s trigny lesz.
14.11. bra - (a) Egy tbbszrsen sszekttt hl feltteles valsznsgi tblkkal. (b)
Egy tbbszrsen sszekttt hl csoportostott ekvivalense.
450
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
fgg a vltoz szleihez mr hozzrendelt rtkektl. Ez az algoritmus lthat a 14.12. brn. A mkdst a
14.11. (a) brn lthat hln szemlltetjk, felttelezve egy [Felhs, Locsol, Es, VizesPzsit] sorrendezst:
1. Sorsoljunk a P(Felhs) = 0,5, 0,5 eloszlsbl; tegyk fel, hogy igaz-at kapunk.
2. Sorsoljunk a P(Locsol Felhs = igaz) = 0,1, 0,9 eloszlsbl; tegyk fel, hogy hamis-at kapunk.
3. Sorsoljunk a P(Es Felhs = igaz) = 0,8, 0,2 eloszlsbl; tegyk fel, hogy igaz-at kapunk.
4. Sorsoljunk a P(VizesPzsit Locsol = hamis, Felhs = igaz) = 0,9, 0,1 eloszlsbl; tegyk fel, hogy
igaz-at kapunk.
Ebben az esetben a PRIOR-MINTA a kvetkez esemnyt adja [igaz, hamis, igaz, igaz].
Knnyen lthat, hogy a PRIOR-MINTA a hl ltal meghatrozott a priori egyttes eloszlsbl generl mintkat.
Elszr, legyen SPS(x1, , xn) annak a valsznsge, hogy egy adott esemnyt legenerl a PRIOR-MINTA
algoritmus. Pusztn a mintavteli folyamat alapjn felrhat, hogy
14.12. bra - Egy mintavtelez algoritmus, amely esemnyeket generl egy Bayeshlbl
Ez a kifejezs ismers, mivel ahogy ezt a (14.1) egyenlet kimondja ez egyben a valsznsge is az egyttes
eloszls Bayes-hls reprezentcija szerinti esemnynek is. Arra jutottunk teht, hogy
SPS(x1xn) = P(x1xn)
Ez az egyszer tny nagyon knnyv teszi lekrdezsek mintk felhasznlsval trtn megvlaszolst.
Brmilyen mintavteli algoritmusban a vlasz kiszmtsa a generls sorn elll mintk megszmllsa
alapjn trtnik. Ttelezzk fel, hogy N teljes mintnk van, s jellje N(x1, , xn) az x1, , xn esemny
gyakorisgt. Azt vrjuk, hogy ez a gyakorisg hatrrtkben konvergljon a vrhat rtkhez a mintavteli
valsznsg szerint:
Pldul gondoljuk meg az elbb generlt esemnyt: [igaz, hamis, igaz, igaz]. Ennek az esemnynek a
mintavteli valsznsge:
SPS(igaz, hamis, igaz, igaz) = 0,5 0,9 0,8 0,9 = 0,324
gy, N nagy rtkeinl azt vrjuk, hogy a mintk 32,4%-a ez az esemny legyen.
A kvetkezkben, amikor a kzelt egyenlsg jelet () hasznljuk, pontosan ilyen rtelemben hasznljuk
azaz a becslt valsznsg egzaktt vlik a nagy mintaszm hatresetben. Az ilyen becslseket
konzisztensnek (consistent) nevezzk. Pldul brmely rszlegesen meghatrozott x1, , xm esemny
valsznsgnek egy konzisztens becslse a kvetkezkppen kaphat meg, ha m n:
451
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
(14.5)
Azaz, az esemny valsznsge megbecslhet a mintavteli folyamat ltal generlt sszes teljes esemny azon
hnyadval, amelyek illeszkednek a rszlegesen meghatrozott esemnyre. Pldul ha generlunk 1000 mintt a
locsols hlbl, s 511-ben kzlk az Es = igaz, akkor az es becslt valsznsge
becsls
az algoritmus ltal kiadott becslt eloszls. Az algoritmus defincija szerint fennll, hogy
Folytatva a 14.11. (a) bra szerinti pldnkat, ttelezzk fel, hogy meg szeretnnk becslni a P(Es Locsol =
igaz)-t, 100 minta felhasznlsval. A 100 ltalunk generlt mintbl, tegyk fel, hogy 73-ban teljesl, hogy
Locsol = hamis, s gy elutastott, mg 27-ben fennll, hogy Locsol = igaz; a 27-bl 8-ban Es = igaz, 19-ben
pedig Es = hamis. gy a
P(Es Locsol = igaz) Normalizl( 8, 19 ) = 0,296, 0,704
A helyes rtk 0,3, 0,7 . A begyjttt mintk szaporodsval a becsls konverglni fog a helyes rtkhez. A
becsls szrsa az egyes valsznsgeknl arnyos lesz
szma.
Az elutast mintavtel legnagyobb hibja, hogy nagyon sok mintt utast el! Az e bizonytkkal konzisztens
mintk arnya exponencilisan egyre kevesebb, ahogy a bizonytkvltozk szma n, gy az eljrs egyszeren
hasznlhatatlan komplex problmkban.
452
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
Vegyk szre, hogy az elutast mintavtel nagyon hasonl a feltteles valsznsgek becslshez, ha
kzvetlenl a valdi vilgbl trtnik a becsls. Pldul a P(Es VrsAzgEste = igaz) becslsnl
egyszeren megszmoljuk, milyen gyakran esik az utn, hogy az elz este az g vrs volt figyelmen kvl
hagyva azokat az estket, amikor az g nem volt vrs. (Itt a vilg maga jtssza a mintagenerl algoritmus
szerept.) Nyilvnvalan, ha az g nagyon ritkn vrs, akkor ez hossz idt vehet ignybe, s ez az, ami az
elutast mintavtel gyengesge.
Valsznsgi slyozs
A valsznsgi slyozs (likelihood weighting) elkerli az elutast mintavtelezs gyengesgt azltal, hogy
csak az e bizonytkkal konzisztens esemnyeket generl. Az algoritmus mkdsnek a lersval kezdjk;
majd megmutatjuk, hogy helyesen mkdik azaz, hogy konzisztens valsznsg becslseket generl. A
VALSZNSGI-SLYOZS (lsd 14.14. bra) rgzti az E bizonytkvltozk rtkeit, s csak a maradk X s
Y vltozkat mintavtelezi. Ez garantlja, hogy minden generlt esemny konzisztens a bizonytkkal. Azonban
nem minden esemny egyenl. Mieltt megllaptannk a szmllsi eredmnyeket a clvltoz eloszlsban,
minden esemnyt slyozunk azzal a valsznsggel, amely megadja, hogy az esemny mennyire van
sszhangban a bizonytkkal. Ezt a valsznsget az egyes bizonytkvltozk feltteles valsznsgeinek a
szorzatval mrjk, a szleik ismeretben. Szemlletesen, azoknak az esemnyeknek, ahol a bizonytk
valszntlennek tnik, kisebb slyt kell adni.
Alkalmazzuk az algoritmust a 14.11. (a) brn lthat hl esetn a P(Es Locsol = igaz, VizesPzsit = igaz)
krdsre. A folyamat a kvetkezkppen halad: elszr a w slyt 1,0-ra lltjuk. Aztn generlunk egy
esemnyt:
1. Sorsoljunk a P(Felhs) = 0,5, 0,5 eloszlsbl; tegyk fel, hogy igaz-at kapunk.
2. A Locsol egy bizonytkvltoz igaz rtkkel. Ezrt belltjuk, hogy
w w P(Locsol = igaz Felhs = igaz) = 0,1
3. Sorsoljunk a P(Es Felhs = igaz) = 0,8, 0,2 eloszlsbl; tegyk fel, hogy igaz-at kapunk.
3. A VizesPzsit egy bizonytkvltoz igaz rtkkel. Ezrt belltjuk, hogy
w w P(VizesPzsit = igaz Locsol = igaz, Es = igaz) = 0,099
Itt a SLYOZOTT-MINTA az [igaz, igaz, igaz, igaz] esemnyt adja ki 0,099 sllyal, s ezt az Es = igaz esetnl
vesszk szmtsba. A sly alacsony, mivel az esemny egy felhs napot r le, amikor valszntlen, hogy a
locsol be van kapcsolva.
Hogy megrtsk, mirt is mkdik a valsznsgi slyozs, azzal kezdjk, hogy megvizsgljuk a SLYOZOTTMINTA SWS mintavteli eloszlst. Emlkezznk, hogy az E bizonytkvltozk rtke (e) rgztett. A tbbi
vltozt Z-vel jelljk, azaz Z = {X} Y. Az algoritmus Z minden vltozjt mintavtelezi, szlei adott
rtkei mellett:
Vegyk szre, hogy a Szlk(Zi) tartalmazhat mind rejtett, mind bizonytkvltozkat is. A P(z) a priori
eloszlstl eltren az SWS eloszls szentel valamennyi figyelmet a bizonytknak is: a mintavtelezett rtkeket
minden Zi esetn befolysoljk a Zi sei kztt lev bizonytkok. Msfell, SWS kevesebb figyelmet szentel a
bizonytkoknak, mint a P(z e) valdi a posteriori eloszls, mivel a mintavtelezett rtkek minden Zi esetn
figyelmen kvl hagyjk azokat a bizonytkokat, amelyek Zi-nek nem sei.8
A w valsznsgi sly ptolja ki a klnbsget a valdi s a kvnt mintavteli eloszls kztt. Egy adott z-bl
s e-bl ll x minta slya az sszes bizonytkvltoz valsznsgnek szorzata a szlei rtkei mellett
(amelyek kzl nhny vagy akr az sszes a Zi-k kztt lehet):
Idelisan, a P(z e) valdi a posteriori eloszlssal megegyez mintavteli eloszlst szeretnnk hasznlni, hogy az sszes bizonytkot
figyelembe vegyk. Ez azonban nem tehet meg hatkonyan. Ha lehetne, akkor a kvnt valsznsget tetszleges pontossggal
kzelthetnnk polinomilis szm mintval. Megmutathat, hogy nem ltezhet ilyen polinom idej kzelt sma.
8
453
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
A (14.6) s (14.7) egyenleteket sszeszorozva lthatjuk, hogy egy minta slyozott valsznsge klnsen
knyelmes alak
mivel a kt szorzat lefedi az sszes vltozt a hlban, lehetv tve, hogy az egyttes valsznsgre a (14.1)
egyenletet hasznljuk.
14.14. bra - A
kvetkeztetshez
valsznsgi
slyozs
algoritmusa
Bayes-hlban
trtn
454
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
Fontos
Most megmutatjuk, hogy az MCMC konzisztens becslseket szolgltat az a posteriori
valsznsgekre. A fejezet anyaga elgg technikai jelleg, de az alapllts egyszer: a mintavteli
folyamat egy olyan dinamikus egyenslyban llapodik meg, amelyben az egyes llapotokban tlttt
id hossz tvon szmolt hnyada pontosan az a posteriori valsznsggel arnyos. Ez a figyelemre
mlt tulajdonsg a specilis tmenetvalsznsg (transition probability) miatt ll fent, amely
szerint a folyamat egyik llapotbl a msikba lp t, ahogyan ezt a feltteles eloszlst a mintavtelezett
vltoz Markov-takarja meghatrozza.
455
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
Akkor mondjuk, hogy egy lnc elrte a stacionrius eloszlst (stationary distribution), ha t = t+1. Jelljk
ezt a stacionrius eloszlst -vel; az ezt definil egyenlet gy
Ha a q tmenet-valsznsg eloszls eleget tesz nhny alapvet feltevsnek,9 akkor brmely q esetn pontosan
egyetlen eloszls elgti ki ezt az egyenletet.
A (14.9) egyenlet gy tekinthet, mint ami azt lltja, hogy az egyes llapotokbl a kilpsek vrhat rtke
(azaz a jelenlegi populci) egyenl az sszes llapotbli belpsek vrhat rtkvel. Ez a kapcsolat
nyilvnvalan teljesthet, ha a vrhat tlpsek mindkt irnyban ugyanakkork brmely llapotpr esetn. Ez
a tulajdonsg a teljes egyensly (detailed balance):
(x)q(x
x) = (x)q(x
x) minden x, x-re (14.10)
Megmutathatjuk, hogy a teljes egyensly maga utn vonja a stacionaritst, egyszeren az x-ek felett sszegezve
a (14.10) egyenletben. Azt kapjuk, hogy
ahol az utols lps abbl kvetkezik, hogy x-bl biztosan trtnik tmenet.
Most megmutatjuk, hogy az MCMC-KRDEZ mintavteli lpsben megadott q(xx) tmenet-valsznsg eleget
tesz a teljes egyensly egyenletnek, ahol a stacionrius eloszls a P(x e), a rejtett vltozk valdi a posteriori
eloszlsa. Ezt kt lpsben teszszk meg. Elszr, egy Markov-lncot definilunk, amelyben minden vltozt az
szszes tbbi vltozval felttelesen mintavteleznk, s megmutatjuk, hogy ez eleget tesz a teljes egyensly
egyenletnek. Majd egyszeren megllaptjuk, hogy Bayes-hlknl ez ekvivalens azzal a feltteles
A q ltal definilt Markov-lncnak ergodikusnak (ergodic) kell lennie azaz lnyegben, minden llapotnak elrhetnek kell lennie
brmely msik llapotbl, s nem lehetnek szigoran periodikus ciklusok.
9
456
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
mintavtelezssel, hogy a felttel a vltoz Markov-takarja (lsd 2.2. szakasz - Feltteles fggetlensgi
relcik Bayes-hlkban rszben).
Legyen Xi a mintavtelezett vltoz, s jellje
Ezt az tmenet-valsznsget nevezik Gibbs-mintavteleznek (Gibbs sampler), ami az MCMC egy nagyon
knyelmes alakja.
Most megmutatjuk, hogy a Gibbs-mintavtelez teljes egyenslyban van a helyes a posteriori eloszlsa szerint:
Ahogy az 2.2. szakasz - Feltteles fggetlensgi relcik Bayes-hlkban rszben kimondtuk, egy vltoz
fggetlen az sszes tbbi vltoztl a Markov-takarjnak a felttelben; gy:
ahol mb(Xi) jelli az Xi Markov-takarjban, MB(Xi)-ben lv vltozk rtkeit. Amint a 14.10. feladat mutatja,
egy vltoz valsznsge a Markov-takarjnak ismeretben arnyos a vltoz szleivel vett feltteles
valsznsgnek s az egyes gyermekek azok szleivel vett feltteles valsznsgeinek a szorzatval:
Fontos
457
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
Eddig rendben is volna. Azonban van egy problma: az elsrend modellek halmaza vgtelen. Ez azt jelenti,
hogy (1) az sszegzs kivitelezhetetlen, s (2) egy teljes, konzisztens eloszls meghatrozsa a vilgok egy
vgtelen halmazn igen bonyolult lehet.
Fogadjunk el ezrt bizonyos korltozsokat, legalbbis idlegesen. Nevezetesen, hogy tervezznk egy olyan
korltozott nyelvet, amelyhez csak vges modell tartozik. Ez szmos mdon megtehet. Itt a relcis
valsznsgi modelleket (relational probability models, RPM) vagy RVM-eket ismertetjk, amelyek a
szemantikus hlk (lsd 10. fejezet) s objektumrelcis adatbzisok elmletbl is vettek t elemeket. Egyb
megkzeltsek az irodalmi s trtneti megjegyzsekben szerepelnek.
Az RVM-ek megengednek konstans szimblumokat, amelyek objektumokat neveznek meg. Pldul legyen
KovcsProf egy professzor neve, Jnos pedig egy dik neve. Minden objektum az osztly egy pldnya: pldul
KovcsProf egy Professzor s Jnos egy Dik. Feltesszk, hogy minden konstans szimblum osztlya ismert.
Fggvnyszimblumaink ktfel lesznek osztva. Az els fajtba tartozk, az egyszer fggvnyek (simple
functions), egy objektumot nem egy msik strukturlt objektumra kpeznek le, hanem egy rtkre egy rgztett
rtktartomnybl, pontosan gy, ahogy egy valsznsgi vltoznl. Pldul az Intelligencia(Jnos) s a
Finanszrozs(KovcsProf) lehet magas vagy alacsony; a Siker(Jnos) s a Hrnv(KovcsProf) lehet igaz vagy
hamis. Fggvnyszimblumok nem alkalmazhatk olyan rtkekre, mint az igaz vagy a hamis, gy nem
lehetsges egyszer fggvnyek egymsba gyazsa. Ezzel elkerljk a vgtelensg egyik forrst. Egy adott
objektumon alkalmazott egyszer fggvny rtke lehet megfigyelt vagy ismeretlen; reprezentcinkban ezek
lesznek az elemi valsznsgi vltozk.10
Megengednk emellett komplex fggvnyeket (complex functions) is, amelyek objektumokat kpeznek le ms
objektumokra. Pldul a Konzulens(Jnos) lehet KovcsProf. Minden komplex fggvnynek van egy megadott
rtktartomnya s rtkkszlete, amik osztlyok. Pldul a Konzulens rtktartomnya a Dik s rtkkszlete a
Professzor. A fggvnyek csak helyes osztlyokra alkalmazhatk; pldul a KovcsProf Konzulens-e nem
definilt. Komplex fggvnyek egymsba gyazhatk: a TanszkVezet(Konzulens(Jnos)) lehet MrProf.
Egyelre feltesszk, hogy minden komplex fggvny rtke ismert az sszes konstans szimblumra. Mivel a TB
vges, ez maga utn vonja, hogy komplex fggvnyek alkalmazsnak minden lncolata elvezet a vges szm
objektum egyikhez.11
Az utols elem, amire szksgnk van, az a valsznsgi informci. Minden egyszer fggvnyhez
specifikljuk a szlk egy halmazt, csakgy, mint a Bayes-hlknl. A szlk lehetnek ugyanannak az
objektumnak ms egyszer fggvnyei; pldul egy Professzor-nak a Finanszrozs-a fgghet a Hrnv-tl. A
szlk lehetnek mg kapcsold objektumok egyszer fggvnyei pldul egy dik Sikere fgghet a dik
Intelligenci-jtl s a dik konzulensnek Hrnv-tl. Ezek valban univerzlisan kvantifiklt lltsok egy
osztly minden objektumnak szleirl. gy rhatjuk azt, hogy
x x Dik Szlk(Siker(x)) = {Intelligencia(x), Hrnv(Konzulens(x))}
(Kevsb formlisan a 14.16. (a) brhoz hasonl diagrammokat rajzolhatunk.) Most megadjuk a gyermek
feltteles valsznsg eloszlst, ahol a felttelt a szlei jelentik. Pldul mondhatjuk, hogy:
Nagyon hasonl szerepet tltenek be, mint a vltozmentes atomi mondatok, amelyek a 9.1. alfejezetben lert tletlogikai lltsokra val
visszavezetsi folyamatban generldnak.
11
Ez a megkts azt jelenti, hogy nem hasznlhatunk olyan komplex fggvnyeket, mint Apa vagy Anya, amelyek potencilisan vgtelen
lncokat eredmnyezhetnnek egy ismeretlen objektummal vgzdve. Ezt a megktst ksbb jra meggondoljuk.
10
458
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
x x Dik P(Siker(x) = igaz | {Intelligencia(x) = magas, Hrnv(Konzulens(x)) =
igaz) = 0,95
Csakgy, mint a szemantikus hlkban, csatolhatunk feltteles eloszlsokat maghoz az osztlyhoz is, gy a
pldnyok rklik (inherit) a fggseket s a feltteles valsznsgeket az osztlytl.
14.16. bra - (a) Egy kt osztlyt (Professzor s Dik) ler RVM. Kt professzor s kt
dik van, mindkt dik konzulense KovcsProf. (b) Az (a)-beli RVM Bayes-hl
ekvivalense.
Az RVM nyelv szemantikja felteszi, hogy minden konstans szimblum egy klnll objektumra hivatkozik
az egyedi nv felttelezst (unique names assumption) a 10. fejezetben rtuk le. Ezen feltevs mellett s a
korbban felsorolt megktsekkel, meg lehet mutatni, hogy minden RVM valsznsgi vltozk egy rgztett,
vges halmazt generlja, amelyek mindegyike egy egyszer fggvny egy konstans szimblumra alkalmazva.
Ekkor feltve, hogy a szl-gyermek fggsek krmentesek megkonstrulhatunk egy ekvivalens Bayeshlt. Azaz az RVM s a Bayes-hl azonos valsznsgeket hatroz meg minden lehetsges vilgra. A 14.6.
(b) bra mutatja azt a Bayes-hlt, ami a 14.16. (a) bra RVM-jhez tartozik. Vegyk szre, hogy az RVM-ben
szerepl Konzulens kapcsolatok nincsenek jelen a Bayes-hlban. Ennek oka, hogy rgztettek s ismertek.
Azonban kzvetetten feltnnek a hl topolgijban; pldul a Siker(Jnos) szlje a Hrnv(KovcsProf),
mivel a Konzulens(Jnos) rtke a KovcsProf. ltalban, az objektumok kztt fennll relcik
meghatrozzk az ezen objektumok tulajdonsgai kztt fennll fggsgeket.
Az RVM-ek kifejezsi erejnek megnvelsre szmos mdszer knlkozik. Megengedhetnk rekurzv
fggseket (recursive dependencies) a vltozk kztt, hogy bizonyosfajta visszatr kapcsolatokat kezelni
tudjunk. Pldul tegyk fel, hogy a gyorsttermi telektl val fggsget egy McGn okozza. Ekkor minden xre McGn(x) fgg a McGn(Apa(x)) s McGn(Anya(x))-tl, amelyek viszont fggnek a McGn(Apa(Apa(x))) s
a McGn(Anya(Apa(x)))-tl s gy tovbb. Br az ilyen tudsbzisok vgtelen vltozt tartalmaz Bayeshlkhoz tartoznak, fixpont-egyenletekbl olykor megoldsokhoz juthatunk. Pldul a kiszmthat a McGn
egyenslyi eloszlsa, az rklds adott feltteles valsznsge mellett. A rekurzv tudsbzisok egy msik
igen fontos csaldja a 15. fejezetben lert idbeli valsznsgi modelleket (temporal probability models)
tartalmazza. Ezekben a modellekben a t idpillanatbeli llapot tulajdonsgai a t 1 idpillanatbeli llapot
tulajdonsgaitl fggnek s gy tovbb.
Az RVM-ek szintn kiterjeszthetk, hogy megengedjenek kapcsolati bizonytalansgot (relational
uncertainty) is azaz bizonytalansgot a komplex fggvnyek rtkeinl. Pldul lehet, hogy nem tudjuk,
kicsoda a Konzulens(Jnos). Ekkor a Konzulens(Jnos) egy valsznsgi vltoz lesz, aminek lehetsges
rtkei KovcsProf s MrProf. A megfelel hlt a 14.17. bra mutatja.
Szintn jelen lehet azonossgi bizonytalansg (identity uncertainty); pldul esetleg nem tudjuk, hogy Mria
s KovcsProf ugyanaz a szemly-e. Azonossgi bizonytalansg esetn az objektumok s az lltsok szma
vltozhat a lehetsges vilgokban. Annak a vilgnak, ahol Mria s KovcsProf ugyanaz a szemly eggyel
kevesebb objektuma van, mint annak a vilgnak, ahol k klnbz szemlyek. Ez a kvetkeztetsi eljrst
bonyolultabb teszi, de a (14.12) egyenlet ltal lefektetett alapelv rvnyben marad: brmely kijelents
valsznsge jl definilt s kiszmthat. Az azonossgi bizonytalansg klnsen fontos robotok s
begyazott rzkelrendszerek esetn, amelyeknek tbb objektumot is kvetnik kell. Erre a problmra a 15.
fejezetben viszszatrnk.
459
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
14.17. bra - Egy Bayes-hl rszlete, ami egy olyan RVM-hez tartozik, amelyben a
Konzulens(Jnos) ismeretlen, de vagy KovcsProf, vagy MrProf. A konzulens
vlasztsa az egyes professzorok finanszrozstl fgg. Vegyk szre, hogy a
Siker(Jnos) most mind a kt professzor Hrnev-tl fgg, br a Konzulens(Jnos) rtke
meghatrozza, hogy valjban melyiknek is van hatsa.
Vizsgljuk meg most a kvetkeztets krdst. Vilgos, hogy a kvetkeztets elvgezhet az ekvivalens Bayeshlban, feltve, hogy az RVM nyelvet gy korltozzuk, hogy az ekvivalens hl vges s rgztett struktrj.
Ez analg azzal a mdszerrel, ahogy elsrend logikai kvetkeztetst vgezhetnk el tletlogikai
kvetkeztetssel, az ekvivalens tletlogikai tudsbzisban (lsd 9.1. alfejezet). Ahogy a logikai esetben is, az
ekvivalens hl tlsgosan nagy ahhoz, hogy megkonstruljuk, klnsen ahhoz, hogy kirtkeljk. A sr
sszektttsg szintn problma (lsd 14.12. feladat). A kzelt algoritmusok, mint az MCMC (lsd 14.5.
alfejezet), ezrt igen hasznosak RVM-kben val kvetkeztetsre.
Amikor az MCMC-t egy egyszer RVM-tudsbzisnak az ekvivalens Bayes-hljra alkalmazzuk, ahol a
tudsbzis nem tartalmaz kapcsolati vagy azonossgi bizonytalansgot, az algoritmus a lehetsges vilgok
terbl mintavtelez, amit az objektumok egyszer fggvnyeinek rtkei hatroznak meg. Vilgosan lthat,
hogy ez a megkzelts kiterjeszthet a kapcsolati s az azonossgi bizonytalansgok kezelsre is. Ebben az
esetben a lehetsges vilgok kztti tmenet lehet, hogy egy egyszer fggvny rtkt vagy egy komplex
fggvnyt vltoztat meg, ami a fggsi struktra megvltozshoz is vezethet. Az tmenetek szintn
megvltoztathatjk a konstans szimblumok kztti azonossgi relcikat. gy az MCMC elegns mdszernek
tnik kvetkeztetsek elvgzsre igen nagy kifejezerej, elsrend valsznsgi tudsbzisokban.
A kutats ezen a terleten mg a kezdeteknl tart, de az egyre nyilvnvalbb, hogy az elsrend valsznsgi
rvels az MI-rendszerek risi hatkonysgnvekedst eredmnyezi a bizonytalansg kezelse kapcsn. A
potencilis alkalmazsok kztt jelen van a szmtgpes lts, a szmtgpes nyelvszet, az informcivisszakeress s a szitucirtkels. Ezen terletek mindegyikn az objektumok halmaza s gy valsznsgi
vltozk halmaza nem ismert elre, gy a tisztn kijelentseken alapul mdszerek, mint pldul a Bayeshlk, nem kpesek a helyzetet teljesen lerni. Ezen mdszereket kiegsztettk a modellek tere feletti
keresssel, de az RVM-ek egyetlen modellben teszik lehetv a kvetkeztetst ilyen tpus bizonytalansg
esetn is.
A bizonytalan ismereteket s/vagy bizonytalan kvetkeztsi formkat tartalmaz kvetkeztetseket a tovbbiakban egysgesen
bizonytalansgi kvetkeztetseknek nevezzk. (A ford.)
12
460
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
Ezt a rgi tradcit ltva taln meglep, hogy az MI a valsznsg-szmts helyett szmos alternatvval
ksrletezett. Az 1970-es vekbeli els szakrti rendszerek teljesen figyelmen kvl hagytk a
bizonytalansgot, s szigoran logikai kvetkeztetst hasznltak, de hamar kiderlt, hogy ez a legtbb vals
problmnl nem alkalmazhat. A szakrti rendszerek kvetkez genercija (klnsen az orvosi
trgytartomnyokban) valsznsgi technikkat hasznlt. A kezdeti eredmnyek biztatk voltak, de nem voltak
sklzhatk nagyobb problmkra a teljes egyttes valsznsg-eloszls megadshoz szksges exponencilis
szm rtk miatt. (Hatkony Bayes-hls algoritmusok ekkor mg nem voltak ismertek.) Ennek
eredmnyekppen a valsznsgi megkzeltsek elvesztettk vonzerejket 1975 s 1988 kztt, s szmos
egyb alternatvt prbltak ki:
Egy elterjedt nzet szerint a valsznsg-szmts alapveten numerikus jelleg, mg az emberi tlethozatal
sokkal kvalitatvabb. Az bizonyos, hogy nem vagyunk tudatban, hogy klnbz fok bizonyossggal
vgznk numerikus szmtsokat. (Ahogyan a logikai egyests elvgzsnek sem vagyunk tudatban, mgis
gy tnik, hogy kpesek vagyunk valamilyenfajta logikai rvelsre.) Lehetsges, hogy a bizonyossg
valamilyen numerikus fokt kzvetlenl troljk az idegsejtek kapcsolatainak s aktivciinak erssgei.
Ebben az esetben ezen erssgek tudatos elrsnek a nehzsge nem meglep. Azt is el kell ismerni, hogy a
kvalitatv kvetkeztetsi mechanizmus a valsznsg-szmtsi alapokra is felpthet, gy a nincsenek
szmok rv a valsznsgek ellen nem meggyz. Mindazonltal nhny kvalitatv mdszer igen
hasznosnak tnhet a sajtos tulajdonsgaik miatt. Az egyik legjobban tanulmnyozott mdszer az
alaprtelmezseken alapul kvetkeztets (default reasoning), ami nem gy kezeli a kvetkeztetetseket,
mint amikben bizonyos fokig hisznk, hanem mint amikben addig hisznk, amg nincs jobb indok valami
mst hinni. Az alaprtelmezseken alapul kvetkeztets a 10. fejezetben szerepel.
Szablyalap (rule-based) megkzeltsekkel is megprbltak bizonytalansgot kezelni. Ezek a mdszerek a
logikai szablyrendszerek sikereit akartk felhasznlni, de hozzadva minden szablyhoz valamilyen
kiagyalt ad hoc tnyezt, ami a bizonytalansgot kezeli. Ezeket az eljrsokat az 1970-es vek kzepn
fejlesztettk ki, s igen nagy szm szakrti rendszer alapjul szolgltak, klnsen orvosi s egyb
terleteken.
Az ismerethiny (ignorance) (ami a bizonytalansggal bizonyos rtelemben szembellthat) krdseit eddig
mg nem rintettk. Fontoljuk meg egy rme feldobst. Ha tudjuk, hogy az rme szablyos, akkor
sszernek tnik, hogy a fej valsznsge 0,5. Ha tudjuk, hogy az rme szablytalan, de nem tudjuk, milyen
mdon, akkor 0,5 az egyetlen sszernek tn valsznsg. Nyilvnval, hogy a kt eset klnbz, de a
valsznsgk lthatan nem klnbzteti meg ket. A Dempster Shafer-elmlet (DempsterShafer
theory) intervallumrtkeket (interval-valued) hasznl a bizonyossg fokozataira, gy reprezentlja az
gens tudst egy llts valsznsgrl. Ms, msodrend valsznsgeket hasznl mdszereket is
trgyalunk majd.
A valsznsg-szmts ugyanazt a ltelmleti feltevst hasznlja, mint a logika: az esemnyek vagy igazak,
vagy hamisak a vilgban, mg ha az gens bizonytalan is, melyik is ll fenn. A fuzzy logika (fuzzy logic)
kutati egy msik ontolgit javasoltak, ami megengedi a meghatrozatlansgot (vagueness) is: azt, hogy
egy esemny lehet valamennyire igaz. A meghatrozatlansg s a bizonytalansg valjban ortogonlis
tmakrk, ahogy azt ltni fogjuk.
A kvetkez hrom alfejezet ezen megkzeltsek mindegyikt egy kicsit rszletesebben mutatja be. Nem
tartalmaznak rszletes technikai lersokat, de a megadott hivatkozsok segtsget nyjtanak tovbbi rszletek
elrshez.
461
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
Fontos
A rossz hr a szablyalap rendszerek szmra, hogy a lokalits, a levlaszts s az igazsgfggvny
egyszeren nem alkalmas a bizonytalansgi kvetkeztets szmra. Vizsgljuk elszr az
igazsgfggvnyt. Legyen F1 az az esemny, hogy fejet kapunk egy szablyos rme feldobsakor,
legyen I1 az az esemny, hogy ugyanekkor rst kapunk, s legyen F2 az az esemny, hogy fejet kapunk
egy szablyos rme msodik feldobsakor. Vilgos, hogy mindhrom esemny valsznsge 0,5, s
egy igazsgtart rendszernek ugyanazt az rtket kell hozzrendelnie brmely kett konjunkcijhoz.
De lthatjuk, hogy a konjunkci valsznsge fgg maguktl az esemnyektl is, nem csak a
valsznsgektl.
Ha nem vigyzunk, ez a kt szably visszacsatolsos mdon fog mkdni gy, hogy az Es-re vonatkoz
bizonytk megnveli a VizesPzsit-hoz tartoz bizonyossgot, ami viszont mg inkbb megnveli az Es-hz
tartoz bizonyossgot. Nyilvnval, hogy bizonytalansgi kvetkeztet rendszereknek nyilvn kell tartaniuk,
hogy milyen utakon terjedt a bizonytk.
Az okok kztti kvetkeztets (vagy kimagyarzs) szintn bonyodalmas. Gondoljuk meg, mi is trtnik, ha a
kvetkez kt szablyunk van:
Locsol VizesPzsit s VizesPzsit Es
Ttelezzk fel, hogy ltjuk a locsolt bekapcsolva. Elrelncolssal a szablyainkon keresztl ez megnveli azt
a bizonyossgot, hogy a pzsit vizes, ami viszont megnveli az eshz tartoz bizonyossgot. De ez
kptelensg: a locsol bekapcsolt llapota megmagyarzza a pzsit vizessgt, gy cskkentenie kell az eshz
tartoz bizonyossgot. Egy igazsgfggvnyen alapul rendszer gy viselkedik, mintha a LocsolEs
szablyban is hinne.
462
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
Ezen nehzsgek mellett hogyan lehetsges, hogy az igazsgfggvnyen alapul rendszereket valaha is
hasznosnak tartottk? A megolds abban rejlik, hogy korltoztk a feladatokat krt, s a szablybzist
gondosan gy terveztk meg, hogy nemkvnatos klcsnhatsok ne kvetkezzenek be. A leghresebb
igazsgfggvnyen alapul rendszer bizonytalansgi kvetkeztetsre a bizonyossgi tnyez (certainty factor)
modell, amit a MYCIN orvosi diagnosztikai program szmra fejlesztettek ki, s szles krben hasznltk
szakrti rendszerekben az 1970-es s az 1980-as vekben. A bizonyossgi tnyezk majdnem minden
alkalmazsa vagy tisztn diagnosztikai (mint a MYCIN), vagy tisztn okozati szablybzist tartalmazott. Tovbb
a tnyek csak a szablybzis gykereinl lptek be, s a legtbb szablybzis egyszeresen sszekttt volt.
Heckerman megmutatta, hogy ezen felttelek mellett a bizonyossgi tnyezkn alapul kvetkeztets kicsit
eltr vltozata ekvivalens a polifabeli Bayes-kvetkeztetssel (Heckerman, 1986). Ms krlmnyek kztt, a
bizonyossgi tnyezk katasztroflisan helytelen bizonyossgot eredmnyezhetnek a tnyek tlzott
figyelembevtele miatt. Amint a szablyhalmaz naggy vlik, a szablyok kztt a nemkvnatos interakcik
egyre gyakoribbak, s a felhasznlk azt talltk, hogy szmos szablynak kell hangolni a bizonyossgi
faktort, amikor j szablyokkal bvtenek. Szksgtelen mondani, hogy ez a megkzelts mr nem ajnlott.
463
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
A fuzzy logika teht egy igazsgfggvnyen alapul rendszer, s ez komoly nehzsgeket okoz. Tegyk fel
pldul, hogy T(MagasSzemly(Nri)) = 0,6 s T(Nehz(Nri)) = 0,4. Ekkor azt kapjuk, hogy
T(MagasSzemly(Nri) Nehz(Nri)) = 0,4, ami elfogadhatnak tnik, de az is addik, hogy
T(MagasSzemly(Nri) MagasSzemly(Nri)) = 0,4, ami mr nem. Vilgos, hogy a problma amiatt lp fel,
hogy az igazsgfggvnyen alapul megkzelts nem kpes kezelni a pozitv s negatv korrelcikat az llts
rszei kztt.
A fuzzy szablyozs (fuzzy control) egy metodolgia olyan szablyozsi rendszerek alkotsra, amelyekben a
vals rtk bemenetek lekpezst a kimeneti paramterekre fuzzy szablyok reprezentljk. A fuzzy
szablyozs nagyon sikeresnek bizonyult olyan kereskedelmi termkekben, mint az automatikus sebessgvltk,
a videokamerk s a villanyborotvk. A kritikusok [lsd pldul (Elkan, 1993)] gy rveltek, hogy ezek az
alkalmazsok azrt sikeresek, mert kicsi a szablybzisuk, nem vgeznek tbblpses kvetkeztetst, s
hangolhat paramtereik vannak, amelyek lltsval a rendszer teljestmnye javthat. Az a tny, hogy fuzzy
mveleteket hasznlnak, mellkes a sikereik szempontjbl; a magyarzat egyszeren az, hogy egy tmr s
szemlletes mdszert biztostanak egyenletesen interpoll, vals rtk fggvnyek megadsra.
Voltak arra irnyul ksrletek, hogy a fuzzy logikt a valsznsg-szmts keretein bell rtelmezzk. Az
egyik elgondols az, hogy az olyan kijelentseket, mint Nri magas gy fogjuk fel, mint egy folytonos rejtett
vltoz, Nri valdi Magassg-nak diszkrt megfigyelseit. A valsznsgi modell meghatrozza a
P(Megfigyel lltja, hogy Nri magas Magassg) valsznsget, pldul az 3.1. szakasz - Bayes-hlk
folytonos vltozkkal rszben lert probit eloszls (probit distribution) felhasznlsval. Ekkor az a posteriori
eloszls Nri magassga felett a megszokott mdon szmolhat ki, pldul ha a modell rsze egy hibrid Bayeshlnak. Egy ilyen megkzelts termszetesen nem igazsgfggvnyen alapul. Pldul a feltteles eloszls
P(Megfigyel lltja, hogy Nri magas Magassg, Sly)
kapcsolatot enged meg a magassg s a sly kztt, ahogyan a megfigyelst okozzk. gy nagyon valszntlen,
hogy valakit, aki kt s fl mter magas s kilencven kilogramm, magas s nehz-nek nevezznk, br a kt s
fl mter magas-nak s a kilencven kilogramm nehz-nek minsl.
A fuzzy prediktumoknak szintn adhat egy valsznsgi rtelmezs a valsznsgi halmazokat (random
sets) felhasznlva azaz olyan valsznsgi vltozkat, amiknek lehetsges rtkei objektumok halmazai.
Pldul a MagasSzemly egy valsznsgi halmaz, amelynek lehetsges rtkei emberek halmazai. A P(Magas
464
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
= S1) valsznsg, ahol S1 az embereknek valamely konkrt halmaza, annak a valsznsge, hogy pontosan ezt
a halmazt minsten magas-nak a megfigyel. Ekkor a Nri magas valsznsge minden olyan halmaz
valsznsgnek az sszege, amelyben Nri elemknt jelen van.
Mind a hibrid Bayes-hls megkzelts, mind a valsznsgi halmaz megkzelts gy tnik, hogy modellezi
a meghatrozatlansg egyes vetleteit bizonyossgok felhasznlsa nlkl. Mindazonltal szmos
megvlaszolatlan krds van a nyelvi megfigyelsek s folytonos mennyisgek helyes reprezentcijval
kapcsolatban, amely krdsekkel a fuzzy kutati kzssgen kvl a tbbsg nem foglalkozik.
8. sszefoglals
Ez a fejezet a Bayes-hlkat (Bayesian networks) mutatta be, amelyek egy jl kidolgozott reprezentcit
jelentenek a bizonytalan tuds szmra. A Bayes-hlk nagyjbl hasonl szerepet tltenek be, mint amit az
tletlogika a biztos tuds szmra.
A Bayes-hl egy irnytott krmentes grf, aminek csompontjai valsznsgi vltozkhoz tartoznak;
minden csomponthoz tartozik egy feltteles eloszls, ahol a felttelt a csompont szlei jelentik.
A Bayes-hlk tmr mdot adnak a trgyterlet feltteles fggetlensgi (conditional independence)
kapcsolatainak a reprezentlsra.
Egy Bayes-hl egy teljes egyttes eloszlst specifikl; egy egyttes bejegyzst a megfelel loklis feltteles
eloszlsokbeli bejegyzsek szorzata hatroz meg. Egy Bayes-hl gyakran exponencilisan kisebb mret,
mint a teljes egyttes eloszls.
Szmos feltteles eloszlst lehet tmren reprezentlni eloszlsok kanonikus csaldjaival. A hibrid Bayeshlk (hybrid Bayesian networks), amelyek mind diszkrt, mind folytonos vltozkat tartalmaznak, sokfle
kanonikus eloszlst hasznlnak.
A kvetkeztets Bayes-hlkban a clvltozk egy halmaza valsznsg-eloszlsnak kiszmtst jelenti,
feltve a tnyvltozk egy halmazt. Az egzakt kvetkeztetsi algoritmusok, mint a vltoz eliminls
(variable elimination) feltteles valsznsgek szorzatainak sszegt rtkelik, amilyen hatkonyan csak
lehet.
Polifkban (polytrees) (egyszeresen sszekttt hlkban) az egzakt kvetkeztets szmtsi ideje a hl
mretvel linerisan n. ltalnos esetben a problma kezelhetetlen.
Sztochasztikus kzelt szmtsi technikk, mint a valsznsgi slyozs (likelihood weighting) s a
Markov lnc Monte Carlo (Markov chain Monte Carlo) mdszerek elfogadhat becslseket adnak a
hlbeli valdi a posteriori valsznsgekre, s sokkal nagyobb hlkkal is megbirkznak, mint az egzakt
algoritmusok.
A valsznsg-szmts kombinlhat az elsrend logikbl vett reprezentcis tletekkel, hogy nagyon
hatkony rendszereket hozzunk ltre bizonytalansg esetn trtn kvetkeztetshez. A relcis valsznsgi
modellek (RVM-ek) eleget tesznek olyan reprezentcis megktseknek, amelyek egy olyan jl definilt
valsznsg eloszlst garantlnak, amely egy ekvivalens Bayes-hlval kifejezhet.
Szmos egyb rendszert is javasoltak a bizonytalansg esetn trtn kvetkeztetshez. Nagy ltalnossgban
azt lehet mondani, hogy az igazsgfggvnyen (truth-functional) alapul rendszerek az ilyen rvelshez
nem a legmegfelelbb eszkzk.
465
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
amelyeket a modern Bayes-hlk elfutrnak lehet tekinteni br a cikkre nem hivatkoznak gyakran ebben a
kontextusban (Good, 1961).13 Ugyanez a cikk az eredeti forrsa a zajos-VAGY modellnek.
A dntsi problmk hatsdiagram (influence diagram) reprezentcijt ami a valsznsgi vltozk
reprezentcijhoz egy irnytott krmentes grfot tartalmazott dntselemzsek sorn hasznltk az 1970-es
vek vge fel (lsd 16. fejezet), de a kirtkelsre csak felsorolst hasznltak. Judea Pearl fejlesztette ki az
zenetvlt eljrst, a fa hlkban (Pearl, 1982a) s az egyszeresen sszekttt (polifa) hlkban (Kim s Pearl,
1983) trtn kvetkeztetsre, s szemben az akkor npszer bizonyossgi tnyezs rendszerekkel, a
diagnosztikai helyett a kazulis valsznsgi modellek ltrehozsnak fontossga mellett rvelt. Az els
szakrti rendszer, ami Bayes-hlkat hasznlt, a CONVINCE volt (Kim, 1983; Kim s Pearl, 1987). A ksbbi
rendszerek kztt talljuk a mozgatidegekkel kapcsolatos rendellenessgek diagnosztizlsra szolgl MUNIN
(Andersen s trsai, 1989) s a patolgis helyzetek feldertsre szolgl PATHFINDER rendszert (Heckerman,
1991). Messze a legtbbet hasznlt Bayes-hls rendszerek a Microsoft Windows diagnziskijavts moduljai
(pldul a Nyomtat varzsl) (Breese s Heckerman, 1996) s az Office segd a Microsoft Office-ban (Horvitz
s trsai, 1998).
ltalnos Bayes-hlkban trtn egzakt kvetkeztetsre Pearl fejlesztett ki egy csoportostson alapul
algoritmust, felhasznlva egy konverzit vltozk csoportjai feletti irnytott polifba, amelyben zenetvltsok
biztostjk a csoportok kzs vltozi feletti konzisztencit. Egy hasonl mdszer, amit David Spiegelhalter s
Steffen Lauritzen fejlesztett ki (Spiegelhalter, 1986; Lauritzen s Spiegelhalter, 1988), egy irnytatlan Markovhlba viv konverzin alapul. Az eljrst a HUGIN rendszerben valstottk meg, ami egy hatkony s szles
krben hasznlt eszkz a bizonytalansgi kvetkeztetsek esetn (Andersen s trsai, 1989). Ross Shachter, a
hatsdiagramok kutati kzssgbl, egy egzakt mdszert fejlesztett ki, ami a hl clirnyos cskkentsn
alapul a posteriori megrz talaktsokat felhasznlva.
A fejezetben lert vltoz elimincis mdszer Shachter mdszerhez ll legkzelebb, amibl a szimbolikus
valsznsgi kvetkeztets (SzVK) mdszere alakult ki (Shachter, 1990). Az SzVK megksrli optimalizlni az
olyan kifejezsi fk kirtkelst, mint amilyen a 14.8. brn lthat. Az ltalunk ismertetett algoritmus a Zhang
s Poole ltal kifejlesztetthez ll a legkzelebb (Zhang s Poole, 1994; 1996). Irrelevns vltozk eltvoltsra
szolgl kritriumokat Geiger s trsai, illetve Lauritzen s trsai fejlesztettek ki (Geiger s trsai, 1990;
Lauritzen s trsai, 1990); az ltalunk megadott kritrium ezeknek egy egyszer specilis esete. Rina Dechter
(Dechter, 1999) mutatta meg, hogy a vltoz eliminls tlete lnyegben megegyezik a nem folytatlagos
dinamikus programozssal (nonserial dynamic programming) (Bertele s Brioschi, 1972). Ez egy
algoritmikus megkzelts, amit Bayes-hlkban elll kvetkeztetsi problmk szles krre lehet sikerrel
alkalmazni. Ilyen problma pldul megfigyelsek egy adott halmazhoz a legvalsznbb magyarzat
megkeresse. Ez sszekapcsolja a Bayes-hls algoritmusokat a knyszerkielgtsi problmkat megold
kapcsold mdszerekkel, s kzvetlen mdszereket szolgltat az egzakt kvetkeztets komplexitsra a hl
hiperfjnak a szlessge alapjn.
Folytonos valsznsgi vltozk jelenltt Bayes-hlkban Pearl, illetve Shachter s Kenley vizsglta (Pearl,
1988; Shachter s Kenley, 1989); ezek a cikkek kizrlag folytonos vltozkat tartalmaz hlkat trgyaltak,
amelyek loklis fggsi modelljei lineris normlis eloszlsak. Diszkrt vltozk bevezetst Lauritzen s
Wermuth vizsglta (Lauritzen s Wermuth, 1989), amit a cHUGIN rendszerben meg is valstottak (Olesen,
1993). A probit eloszlst elszr Finney vizsglta (Finney, 1947), szigmoid eloszlsnak nevezve. Az eloszlst
szles krben hasznljk diszkrt vlasztsi jelensgek modellezsre, s kiterjeszthet tbb mint kt vlasztsi
lehetsg kezelsre (Daganzo, 1979). A logit eloszls hasznlathoz Bishop ad indoklst (Bishop, 1995).
Cooper mutatta meg, hogy a kvetkeztets ltalnos problmja tetszleges Bayes-hlban NP-teljes (Cooper,
1990), Paule Dagum s Mike Luby pedig azt, hogy ennek a kzelt megoldsa is NP-teljes (Dagum s Luby,
1993). A trkomplexits szintn komoly problma mind a csoportost, mind a vltoz elimincis
mdszereknl. A vghalmaz felttelezseken (cutset conditioning) alapul eljrs, amit a knyszerkielgtsi
problmkra az 5. fejezetben mutattunk be, elkerli az exponencilis mret tblk ltrehozst. Egy Bayeshlban a vghalmaz a csompontok azon halmaza, amelyek rtkeinek rgztse esetn a fennmarad
csompontok fggsei egy fagrfra egyszersdnek, ami mr lineris idben s trben megoldhat. A
lekrdezst sszegzssel adhatjuk meg a vghalmaz minden lehetsges rtkadsa mellett, gy az sszes
trigny mg mindig lineris (Pearl, 1988). Darwiche (Darwiche, 2001) egy rekurzvan felttelez algoritmust
ad meg, ami tetszleges tr/id egyenslyt tesz lehetv.
I. J. Good vezet statisztikus volt Turing kdfeltr csapatban a msodik vilghbor sorn. A 2001: rodsszeia c. mvben Arthur C.
Clarke Goodnak s Minskynek tulajdontotta azokat az ttrseket, amelyek a HAL szmtgp kifejlesztshez vezettek (Clarke, 1968a).
13
466
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
Gyors kzelt algoritmusok Bayes-hlkra val kifejlesztse nagyon aktv terlet, a statisztika, a
szmtselmlet s a fizika hatrterletn. Az elutast mintavtelezs mdszere egy ltalnos, a statisztikban
rgta ismert technika; Bayes-hlknl Max Henrion alkalmazta elszr, aki logikai mintavtelezsnek (logic
sampling) nevezte (Henrion, 1988). A valsznsgi slyozs, amit Fung s Chang (Fung s Chang, 1989),
illetve Shachter s Peot fejlesztettek ki (Shachter s Peot, 1989), egy pldja a fontossgi mintavtel
(importance sampling) jl ismert statisztikai mdszernek. A valsznsgi slyozs nagymrv felhasznlst
az orvosi diagnosztikban Shwe s Cooper jelenti (Shwe s Cooper, 1991). Cheng s Druzdzel a valsznsgi
slyozs adaptv verzijt kzlik (Cheng s Druzdzel, 2000), ami akkor is jl mkdik, ha a bizonytk a priori
valsznsge nagyon alacsony.
A Markov lnc Monte Carlo (MCMC) mdszerek a Metropolis algoritmussal kezddtek, ami Metropolisnak
ksznhet (Metropolis s trsai, 1953), ami a 4. fejezetben lert szimullt lehts algoritmusnak szintn a
forrsa. A Gibbs-mintavtelezt Geman s Geman fejlesztette ki irnytatlan Markov-hlkban trtn
kvetkeztetsre (Geman s Geman, 1984). Az MCMC Bayes-hlkban trtn alkalmazsa Pearlnek
ksznhet (Pearl, 1987). A Gilks s trsai ltal sszegyjttt cikkek MCMC-alkalmazsok szles skljt
lelik fel, szmos kzlk a jl ismert BUGS csomaggal lett kifejlesztve (Gilks s trsai, 1996).
A kzeltsi mdszereknek kt nagyon fontos csaldja ltezik, amelyeket nem trgyaltunk a fejezetben. Az els
csald a varicis kzelts (variational approximation) mdszere, ami mindenfajta komplex szmts
egyszerstsre felhasznlhat. Az alaptlet az, hogy az eredeti problmnak ellltjuk egy olyan reduklt
verzijt, ami annyira egyszer, hogy dolgozni lehessen vele, de amennyire lehet hasonl az eredeti
problmhoz. A reduklt problma lersa tartalmazza a varicis paramtereket (variational parameters),
amelyeket gy lltunk be, hogy minimalizljon egy D tvolsgfggvnyt az eredeti s a reduklt problmk
kztt, gyakran a D/ = 0 egyenletrendszer megoldsval. Szmos esetben pontos fels s als korltok
kaphatk. Varicis mdszereket rgta hasznlnak a statisztikban (Rustagi, 1976). A statisztikus fizikban a
meztlag (mean field) mdszer egy specilis varicis mdszer, amelyben a modellt alkot egyes vltozkat
teljesen fggetlennek ttelezzk fel. Ezt az tletet felhasznlva sikerlt kezelni nagy irnytatlan Markovhlkat (Peterson s Anderson, 1987; Parisi, 1988). A varicis mdszerek Bayes-hlkra trtn
alkalmazsnak matematikai megalapozst Saul s trsai fejlesztettk ki, s k kaptak a szigmoid hlkra
pontos als korlt kzeltseket a meztlag mdszerrel (Saul s trsai, 1996). Jaakkola s Jordan gy
terjesztettk ki a mdszert (Jaakkola s Jordan, 1996), hogy mind az als, mind a fels korlt kinyerhet legyen.
A varicis mdszereket Jordan tekintette t (Jordan, 1999).
A kzelt algoritmusok msodik csaldja Pearl fagrfon fut zenetvltsos algoritmusn alapszik (Pearl,
1982a). Az algoritmust ltalnos hlkra is lehet alkalmazni, ahogy Pearl javasolta (Pearl, 1988). Az
eredmnyek lehetnek helytelenek, s lehet, hogy az algoritmus nem ll le, de szmos esetben a szolgltatott
rtkek kzel vannak a helyes rtkekhez. Ez az gynevezett bizonyossgterjesztses (belief propagation)
vagy hurkos terjesztses (loopy propagation) megkzelts kevs figyelmet kapott, mindaddig, amg
McEliece s trsai fel nem figyeltek (McEliece s trsai, 1998) arra, hogy az zenetvlts tbbszrsen
sszekttt Bayes-hlkban pontosan megegyezik a turb dekdols (turbo decoding) algoritmus ltal vgzett
szmtssal (Berrou s trsai, 1993), ami jelents ttrst eredmnyezett a hibajavt kdok tervezsben. Ebbl
az a kvetkeztets vonhat le, hogy a bizonyossgterjeszts gyors is s pontos is a nagyon nagy mret s
nagyon srn sszekttt dekdolsra hasznlt hlkban, s ezrt lehet, hogy ltalnosabban is hasznos lehet.
Murphy s trsai egy ksrletrl szmoltak be, ahol ez valban mkdtt (Murphy s trsai, 1999). Yedidia s
trsai tovbbi kapcsolatokra mutattak r a bizonyossgterjeszts s a statisztikus fizika kztt (Yedidia s trsai,
2001).
A valsznsg s az elsrend nyelvek kztti kapcsolatot Carnap tanulmnyozta (Carnap, 1950). Gaifman,
illetve Scott s Krauss megadott egy nyelvet, amelyben valsznsgeket elsrend mondatokhoz lehet
kapcsolni, s amelyre a modellek valsznsgi mrtkek voltak lehetsges vilgokon (Gaifman, 1964; Scott s
Krauss, 1966). Az MI-n bell ezt az tletet az tletlogikra Nilsson, a prediktumlogikra pedig Halpern
fejlesztette ki (Nilsson, 1986; Halpern, 1990). A tudsreprezentcis krdsek els kiterjedt vizsglatt ilyen
nyelvek esetn Bacchus vgezte (Bacchus, 1990), Wellman s trsainak a tanulmnya a korai implementcikat
tekinti t (Wellman s trsai, 1992), amelyek egy ekvivalens (tletlogikai) Bayes-hl ltrehozsn alapulnak.
Napjainkra a kutatk elkezdtk megrteni a teljes tudsbzisok fontossgt, azaz olyan tudsbzisok
fontossgt, amelyek akr a Bayes-hlk, egy egyrtelm egyttes eloszlst definilnak az sszes lehetsges
vilg felett. Az erre szolgl eljrsok a logikai programozs valsznsgi verziin (Poole, 1993; Sato s
Kameya, 1997) vagy szemantikus hlkon (Koller s Pfeffer, 1998) alapultak. A fejezetben ismertetett tpus
relcis valsznsgi modelleket Pfeffer vizsglta rszletesebben (Pfeffer, 2000). Pasula s Russell mind a
relcis, mind az azonossgi bizonytalansgot vizsglta az RVM-ekben s az MCMC kvetkeztets
felhasznlsban (Pasula s Russell, 2001).
467
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
Amint a 13. fejezetben kifejtettk, a korai valsznsgi rendszerek kegyvesztettek lettek az 1970-es vekben,
helyt adva az alternatv mdszerek megjelensnek. A bizonyossgi tnyezket a MYCIN orvosi szakrti
rendszerbeli felhasznlsra fejlesztettk ki (Shortliffe, 1976), amit egyrszt mrnki megoldsnak is, msrszt
az emberi tlethozatal modelljnek is javasoltk, bizonytalansg esetben. A Rule-Based Expert Systems
gyjtemny (Buchanan s Shortliffe, 1984) teljes ttekintst ad a MYCIN-rl s leszrmazottairl (lsd mg
[Stefik, 1995]). David Heckerman megmutatta, hogy a bizonyossgi tnyezs szmtsok kicsit mdostott
verzija mr helyes valsznsgeket ad bizonyos esetekben, de ms esetekben a bizonytkok hibt okoz,
tlzott figyelembevtelre vezet (Heckerman, 1986). A PROSPECTOR szakrti rendszer (Duda s trsai, 1979)
szablyalap megkzeltst hasznlt, amiben a szablyokat (ritkn tarthat) globlis fggetlensgi
felttelezsekkel igazoltk.
A DempsterShafer-elmlet Arthur Dempster publikcijval kezddtt, amiben a pontszer valsznsgi
rtkek ltalnostst javasolta intervallumrtkekre, s szablyokat javasolt a kombinlsukra (Dempster,
1968). Glenn Shafer ksbbi munkja vezetett el a DempsterShafer-elmlet s a valsznsg-szmts
egymssal verseng szemllethez (Shafer, 1976). Ruspini a DempsterShafer-elmlet s a valsznsgszmts kapcsolatt elemezte (Ruspini s trsai, 1992). Shenoy a DempsterShafer bizonyossgfggvny
alapjn egy eljrst javasolt a dntshozatalra (Shenoy, 1989).
A fuzzy halmazokat Lotfi Zadeh dolgozta ki vlaszul arra a nehzsgre (Zadeh, 1965), hogy egzakt bemeneti
rtkeket adjunk az intelligens rendszerek szmra. Zimmermann lersa (Zimmermann, 2001) rszletes
bevezetst nyjt a fuzzy halmazok elmletbe; a (Zimmermann, 1999) pedig fuzzy alkalmazsokrl szl
cikkek gyjtemnye. Amint korbban emltettk, a fuzzy logikt gyakran tekintik a valsznsg-szmts
versenytrsnak, pedig valjban eltr krdsekkel foglalkozik. A lehetsgelmletet (possibility theory)
(Zadeh, 1978) a bizonytalansg kezelsre vezettk be fuzzy rendszerekben, s sok kzs vonsa van a
valsznsg-szmtssal. Dubois s Prade alapos ttekintst nyjt a lehetsgelmlet s a valsznsgszmts kapcsolatrl (Dubois s Prade, 1994).
A valsznsg-szmts MI-n belli feltmadsa fknt a Bayes-hlk felfedezsn mlt, ami mdszert adott a
feltteles fggetlensgek reprezentlsra s kihasznlsra. Ez az jjszlets igen kzdelmes volt; Peter
Cheeseman harcias In defense of Probability (Cheeseman, 1985) s a ksbbi An Inquire into Computer
Understanding (Cheeseman, 1988, megjegyzsekkel) c. cikke zeltt ad a vitbl. A logika mvelinek egyik
legfbb kifogsa az volt, hogy a valsznsg-szmts miatt szksgesnek vlt szmtsok nelemzssel nem
rhetk el, s egy nem relis pontossgi szintet tteleznek fel a bizonytalan tudsunkban. A kvalitatv Bayeshlk (qualitative probabilistic networks) (Wellman, 1990a) lehetsget adnak a Bayes-hlk tisztn
kvalitatv absztrakcijra, csupn a vltozk kztti hatsok pozitv s negatv jellegt kihasznlva. Wellman
megmutatta, hogy szmos esetben ennyi informci is elegend az optimlis dntshozatalhoz a valsznsgi
rtkek precz meghatrozsa nlkl. Adnan Darwiche s Matt Ginsberg munkja kivonatolja a valsznsgszmts elmletben szerepel felttelessg s a tnyek kombinlsnak alapvet tulajdonsgait, s
megmutatja, hogyan lehet ezeket alkalmazni logikai s alaprtelmezsi kvetkeztetsekben (Darwiche s
Ginsberg, 1992).
A fejezetben lert szvbetegsg-kezel rendszer Lucastl szrmazik (Lucas, 1996). A Bayes-hlk ms terleten
trtn alkalmazsai kztt talljuk egyebek kztt a Microsoftnl vgzett fejlesztseket a felhasznl cljainak
kikvetkeztetsre (Horvitz s trsai, 1998) s a kretlen elektronikus levelek szrsre (Sahami s trsai, 1998),
az Electric Power Research Institute fejlesztst ramgenertorok figyelsre s a NASA fejlesztst idkritikus
informcik megjelentsre a Mission Controlnl Houstonban (Horvitz s Barry, 1995).
Az MI-n belli bizonytalansgi kvetkeztetssel kapcsolatos szmos fontos korai publikci megtallhat a
Readings in Uncertain Reasoning (Shafer s Pearl, 1990) s az Uncertainty in Artifical Intelligence (Kanal s
Lemmer, 1986) antolgikban. A Bayes-hlk tmakrnek fejldsben a legfontosabb egyedlll publikci
vitathatatlanul a Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference (Pearl, 1988).
Tbb kivl munka tartalmazza az jabb anyagokat, mint pldul (Lauritzen, 1996; Jensen, 2001; Jordan, 2003).
A valsznsgi kvetkeztetssel kapcsolatos j eredmnyek mind az MI f irnyait meghatroz fbb
lapokban, mint pl. az Artificial Intelligence-ben, mind a specializltabb folyiratokban, mint amilyen az
International Journal of Approximate Reasoning jelennek meg. A grfos modellekrl (graphical models),
amely modellosztly magban foglalja a Bayes-hlkat is, szmos cikk statisztikai jsgokban jelenik meg. Az
Uncertainty in Artificial Intelligence (UAI), a Neural Information Processing Systems (NIPS) s az Artificial
Intelligence and Statistics (AISTATS) konferencik kiadvnyai kivl forrsai a legfrissebb kutatsoknak.
468
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
14.18. bra - Egy gpkocsi elektromos s motorikus rendszereinek rszeit ler Bayeshl. Minden vltoz binris, s az igaz rtk jelzi a megfelel funkci helyes
mkdst.
8.2. Feladatok
14.1.
Tekintsk a 14.18. brn lthat gpkocsi-diagnosztikai hlt.
a. Egsztse ki a hlt a JegesId s az IndtMotor binris vltozkkal.
b. Adjon meg sszer feltteles valsznsgi tblkat az sszes csompontra.
c. Hny fggetlen rtket tartalmaz a teljes egyttes valsznsg-eloszls fggvny 8 binris csompont
esetn, felttelezve, hogy nincs kzttk feltteles fggetlensgi relci?
d. Hny fggetlen valsznsgi rtket tartalmaznak az n hljnak tblzatai?
e. A Beindul feltteles valsznsg eloszlsa megadhat egy zajos-S eloszlssal. rja le ezt az
eloszlscsaldot ltalban s kapcsolatt a zajos-VAGY eloszlshoz.
14.2.
A helyi nukleris ermben van egy riaszt, ami rzkeli, ha a hmrskletmr egy adott kszbrtket
meghalad. A mr a reaktormag hmrsklett mri. Tekintse a kvetkez binris vltozkat: R (riaszt hangja),
HR (hibs riaszt), HM (hibs mr) s a kvetkez tbbrtk vltozkat: M (mr) s H (egy aktulis bels
hmrsklet).
a. Rajzoljon fel egy Bayes-hlt a trgytartomnyra, felttelezve, hogy valsznbb, hogy a mr akkor
hibsodik meg, ha a hmrsklet tl magas.
b. A hlzata polifa lett?
c. Ttelezze fel, hogy a hmrskletnek csak kt lehetsges rtke van: normlis s magas; s hogy a mr
helytelen hmrskletet mr az esetek x%-ban, ha mkdik, s y%-ban, ha hibs. Adja meg az M feltteles
valsznsg-tblit.
469
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
d. Ttelezze fel, hogy a riaszt tkletesen mkdik, hacsak nem hibs, mely utbbi esetben egyltaln nem
riaszt. Adja meg az R-hez tartoz feltteles valsznsg-tblt.
e. Ttelezze fel, hogy a mr s a riaszt mkdik, s a riaszt megszlal. Fejezze ki annak a valsznsgt,
hogy a reaktormag hmrsklete magas a hl feltteles valsznsgeinek a fggvnyben.
14.3.
Kt csillagsz tvcsveiket hasznlva a vilg klnbz rszein M1 s M2 mrseket vgeznek az gbolt egy
kis rszn lthat csillagok szmrl (Sz). ltalban egy kis e valsznsge a hibnak, ami egy csillagnyi
eltrst jelent. Brmelyik tvcsvel megtrtnhet az is (egy sokkal kisebb f valsznsggel), hogy nincs
rendesen fkuszlva (F1 s F2 esemnyek), amely esetben a tuds 3 vagy tbb csillaggal kevesebb csillagot
szmll (ha Sz kisebb mint 3, akkor egyetlen csillagot sem szlel). Tekintsk a 14.19. brn lthat hrom hlt.
a. Melyik Bayes-hl reprezentlja helyesen (de nem felttlenl hatkonyan) a fenti ismereteket?
b. Melyik a legjobb hl? Adjon magyarzatot.
c. Adjon meg egy sszer feltteles valsznsgi tblt a P (M1 Sz) rtkeire, amikor M1 {0, 1, 2, 3, 4} s Sz
{1, 2, 3}. A feltteles eloszls minden rtkt az e s az f paramterek fggvnyben fejezze ki.
d. Ttelezze fel, hogy M1 = 1 s M2 = 3. Mik a csillagok lehetsges szmai, ha a priori nem korltozzuk Sz
rtkt?
e. Mi a csillagok legvalsznbb szma ezen megfigyelsek esetn? Magyarzza el ennek kiszmtst, vagy ha
nem lehetsges kiszmtani, magyarzza el, milyen tovbbi informcikra van szksg, s hogy az miknt
befolysoln az eredmnyt.
14.4.
Tekintsk a 14.19. (ii) brn lthat hlt, s tegyk fel, hogy a kt teleszkp azonosan mkdik. Legyen M1, M2
{0, 1, 2, 3, 4} s Sz {1, 2, 3} a 14.3. feladatban megadott szimbolikus FVT-kkel. A felsorol algoritmus
felhasznlsval szmolja ki a kvetkez valsznsg-eloszlst: P(Sz M1 = 2, M2 = 2).
14.5.
Tekintsk a lineris Gauss loklis eloszls hlk csaldjt, amit az 3.1. szakasz - Bayes-hlk folytonos
vltozkkal rsz illusztrl.
a. Egy ktvltozs hlban legyen X1 az X2 szlje, X1-nek legyen normlis a priori eloszlsa, P(X2 X1) pedig
egy lineris normlis eloszls. Mutassa meg, hogy a P(X1, X2) egyttes eloszls egy tbbvltozs Gausseloszls, s szmolja ki ennek a kovarianciamtrixt.
b. Bizonytsa be indukcival, hogy egy ltalnos lineris Gauss-hl X1, , Xn-en vett egyttes eloszlsa szintn
tbbvltozs Gauss-eloszls.
470
Created by XMLmind XSL-FO Converter.
Valsznsgi kvetkeztets
14.6.
Az 3.1. szakasz - Bayes-hlk folytonos vltozkkal rszben definilt probit eloszls egy binris gyermek
valsznsg-eloszlst rja le, egyetlen folytonos szl esetn.
a. Hogyan terjeszthet ki a definci tbb folytonos szl esetre?
b. Hogyan terjeszthet ki, hogy tbbrtk gyermekvltozra is alkalmazhat legyen? Gondolja vgig mind a
kt esetet, amikor a gyermek rtkei sorrendezettek (ahogyan a vezetsnl a sebessgfokozat megvlasztsa a
sebessg, a lejts, a kvnt gyorsuls stb. fggvnye), s amikor nem llthatk sorba (mint pldul a busz, a
vonat vagy a kocsi vlasztsa munkba menetelnl). (Segtsg: gondoljunk a lehetsges rtkek kt csoportra
osztsra, hogy binris vltozt szimulljunk.)
14.7.
Ez a feladat a 14.10. brn lthat vltoz elimincis algoritmusra irnyul.
a. A 14.4. alfejezet a vltoz eliminlst alkalmazza arra a lekrdezsre, hogy
P(Betrs JnosTelefonl = igaz, MriaTelefonl = igaz)
Valsznsgi kvetkeztets
d. Tegyk fel, hogy egy folytonos rtk vltozt szeretne lekrdezni, s egy olyan mintavtelez algoritmust
hasznl a kvetkeztetsre, mint a VALSZNSGISLYOZS. Hogyan kellene mdostania a lekrdezsvlaszads folyamatt?
14.10.
Egy vltoz Markov-takarjt (Markov blanket) az 2.2. szakasz - Feltteles fggetlensgi relcik Bayeshlkban definiltuk.
a. Bizonytsa be, hogy a vltoz fggetlen a hl sszes tbbi vltozjtl, ha Markov-takarja ismert.
b. Vezesse le a (14.11) egyenletet.
14.11.
Tekintsk a P(Es Locsol = igaz, VizesPzsit = igaz) lekrdezst a 14.11. (a) bra szerint, s annak az MCMC
mdszerrel val megvlaszolst.
a. Hny llapota van a Markov-lncnak?
Szmtsa ki a Q llapottmenet-mtrixot (transition matrix Q), ami tartalmazza az sszes q(yy) rtket
minden y-ra s y-ra.
b. Mit reprezentl Q2, az llapottemeneti mtrix ngyzete?
c. Mi lesz Qn, ha n ?
d. Magyarzza el, hogy hajtsunk vgre valsznsgi kvetkeztetst Bayes-hlkban, ha Qn elrhet. Hatkony
mdja ez a kvetkeztetsnek?
14.12.
Hrom focicsapat, A, B s C jtszik egyms ellen. Minden meccsen kt csapat vesz rszt, az eredmny pedig
gyzelem, veresg vagy dntetlen lehet. Minden csapatnak egy rgztett, ismeretlen fokozat jtkszintje van
ami egy 0 s 3 kztti egsz rtk , s egy meccs eredmnye a kt csapat jtkszintje kztti klnbsgtl fgg
sztochasztikusan.
a. Hozzon ltre egy relcis valsznsgi modellt a trgyterletre, s javasoljon rtkeket az sszes szksges
valsznsg-eloszlsra.
b. Hozzon ltre egy ekvivalens Bayes-hlt.
c. Tegyk fel, hogy az els kt meccsen A megveri B-t, C-vel pedig dntetlent jtszik. Egy tetszleges egzakt
kvetkeztetst felhasznlva, szmtsa ki a harmadik meccs a posteriori eloszlst.
d. Tegyk fel, hogy n csapat vesz rszt a bajnoksgon, s minden eredmnynk megvan, kivve az utolst.
Hogyan vltozik az utols meccs megjslsnak a komplexitsa az n fggvnyben?
e. Vizsglja meg az MCMC alkalmazst ezen a problmn. Milyen gyorsan konvergl az MCMC a
gyakorlatban, s hogyan sklzhat fel?
472
Created by XMLmind XSL-FO Converter.
1. Id s bizonytalansg
A valsznsgi kvetkeztetsre szolgl technikinkat vltozatlan (static) vilgok esetn fejlesztettk ki,
amelyekben minden egyes valsznsgi vltoznak egyetlen rgztett rtke van. Pldul egy gpkocsi
javtsnl feltesszk, hogy ami meghibsodott, az a diagnosztizls alatt is hibs marad; a feladatunk a
gpkocsi llapotnak kikvetkeztetse a megfigyelt bizonytkokbl, amelyek szintn vltozatlanok maradnak.
Most vegynk fontolra egy msfle problmt: egy cukorbeteg pciens kezelst. Akrcsak a gpkocsijavts
esetn, rendelkeznk bizonytkokkal: a jelenlegi inzulinadagok, az lelmiszer-bevitel, a vrcukorszint
mrsnek eredmnyei s egyb testi tnetek. A feladat a pciens jelenlegi llapotnak rtkelse, belertve az
aktulis vrcukorszintet s inzulinszintet. Ezeknek az informciknak az alapjn az orvos (vagy a pciens)
dntst hoz a pciens lelmiszer-beviteli s inzulinadagjrl.
A gpkocsijavts esettl eltren, itt a problma dinamikai vonatkozsai alapvetek. A vrcukorszintek s
mrseik idvel gyorsan vltozhatnak, amit befolysol a pciens aktulis lelmiszer-bevitele s inzulinadagja, az
anyagcsere aktivitsa, a napszak s egyb tnyezk. Ahhoz, hogy a bizonytkok idbeli alakulsbl a jelenlegi
llapotot megbecsljk, s egy kezels kimenetelt megjsoljuk, modelleznnk kell ezeket a vltozsokat.
Ugyanezek a szempontok szmos ms esetben is jelentkeznek, egy nemzet gazdasgi aktivitsnak kzelt s
rszleges statisztikk alapjn trtn kvetstl, beszdszekvencik zajos s tbbrtelm akusztikai
mrsekbl trtn megrtsig. Addik a krds: hogyan lehet az ezekhez hasonl dinamikai helyzeteket
modellezni?
473
Created by XMLmind XSL-FO Converter.
gy egy elsrend Markov-folyamatban az llapotok idbeli vltozst ler szablyokat teljes mrtkben
tartalmazza a P(Xt|X1t) feltteles eloszls, amit az elsrend folyamat llapottmenet-modelljnek (transition
model) neveznk.2 A 15.1. bra elsrend s msodrend Markov-folyamatokhoz tartoz Bayeshlstruktrkat mutat.
1
2
Vegyk szre, hogy a Vrcukort s a MrtVrcukort kt klnbz vltoz, gy kezeljk az aktulis mennyisgek zajos mrst.
Az llapottmenet-modell a valsznsgi analgja a 7. fejezet logikai frisst ramkrnek s a 10. fejezet kvet llapot aximinak.
474
Created by XMLmind XSL-FO Converter.
A P(Et|Xt) feltteles eloszlst rzkel modellnek (sensor model) nevezik (vagy nha megfigyelsi modellnek
[observational model]), mivel lerja, hogy az rzkelket azaz a bizonytkvltozkat hogyan
befolysolja a vilg aktulis llapota. Vegyk szre a fggs irnyt: a nyl az llapottl az rzkel rtkre
mutat, mivel a vilg llapota okozza azt, hogy az rzkelk bizonyos rtkeket vegyenek fel. Az esernys
vilgban pldul az es okozza az eserny feltnst. (A kvetkeztetsi folyamat termszetesen a msik
irnyban halad; a modellezett fggsek irnya s a kvetkeztets irnya kztti klnbsgttel a Bayes-hlk
egyik f elnye.)
Az llapottmenet-modellhez s az rzkel modellhez mg meg kell adnunk egy P(X0) a priori eloszlst a 0.
idpontbeli llapotok felett. Ez a hrom eloszls, kombinlva a (15.1) s a (15.2) egyenletekben megfogalmazott
feltteles fggetlensgi lltsokkal, biztostja szmunkra a teljes egyttes eloszls meghatrozst az sszes
vltoz felett. Brmely vges t-re azt kapjuk, hogy
A fggetlensgi lltsok egy nagyon egyszer Bayes-hlstruktrnak felelnek meg, ami az egsz rendszert
lerja. A 15.2. brn lthat a hl struktrja az esernys plda esetn, belertve az llapottmenet- s az
rzkel modellekhez tartoz feltteles eloszlsokat.
Az brn lv struktra elsrend Markov-folyamat felttelezsen alapul, mivel feltesszk, hogy az es
valsznsge csak attl fgg, hogy az elz nap esett-e. Egy ilyen feltevsnek a helynvalsga magtl a
trgyterlettl fgg. Az elsrend Markov-felttel kimondja, hogy az llapotvltozk az sszes olyan
informcit tartalmazzk, amely a kvetkez idpontbeli valsznsg-eloszlsok megadshoz szksges.
Nha ez a feltevs pontosan teljesl pldul ha egy rszecske vletlen bolyongst (random walk) vgez az x
tengelyen, 1-gyel vltoztatva meg a pozcijt minden idpontban, ekkor az x koordintt hasznlva
llapotknt, egy Markov-lnc addik. Gyakran a feltevs csak kzelt, mint amikor az es jslsa csak az
alapjn trtnik, hogy esett-e az elz napon. Kt lehetsges javts ltezik, ha a kzelts tlsgosan
pontatlannak bizonyul:
1. A Markov-folyamat rendjnek a megnvelse. Pldul ltrehozhatnnk egy msodrend modellt, felvve egy
Est2-t mint az Est szljt, ami lehet, hogy valamivel pontosabb predikcit adna (pldul Palo Altban
nagyon ritkn esik tbb mint kt napig egyfolytban).
2. Az llapotvltozk halmaznak megnvelse. Pldul felvehetnnk az vszakt vltozt, hogy ez lehetv
tegye szmunkra az ess vszakok trtneti feljegyzseinek beptst, vagy hozzadhatnnk a Hmrsklett,
a Pratartalomt s a Lgnyomst vltozkat, hogy az es feltteleinek fizikai modelljeit felhasznlhassuk.
475
Created by XMLmind XSL-FO Converter.
A 15.1. feladat annak megmutatst kri, hogy az els megolds a folyamat rendjnek a megnvelse
mindig tfogalmazhat az llapotvltozk halmaznak megnvelsre, vltozatlanul hagyva a rendet. Vegyk
szre, hogy llapotvltozk hozzadsa javthatja a rendszer elrejelz erejt, de megnveli a predikcis
kvetelmnyeket is: ekkor mr az j vltozkat is jsolni kell. gy a vltozknak egy nmagban elgsges
halmazt keressk, ami valjban azt jelenti, hogy meg kell rtennk a modellezett folyamat fizikjt. A
folyamat pontos modellezse irnti kvetelmny nyilvnvalan mrskeltebb, ha j rzkelket vehetnk fel
(pldul a hmrsklet s a nyoms mrsre), amelyek kzvetlenl az j llapotvltozkrl szolgltatnak
informcit.
Gondoljuk meg pldul egy XY skon vletlenszeren stl robot kvetsnek a problmjt. Egy javaslat az
llapotvltozk egy elgsges halmazra ekkor a pozci s a sebessg lehet: Newton trvnyeit felhasznlva
kiszmolhat az j pozci, s a sebessg megjsolhatatlanul vltozik. Ha azonban a robot akkumultorrl
zemel, akkor az elem lemerlsnek tipikusan van egy szisztematikus hatsa a sebessg megvltozsra. Mivel
ez viszont fgg attl, hogy mennyi energia hasznldott el az sszes korbbi manverben, a Markov-tulajdonsg
srl. A Markov-tulajdonsgot helyrellthatjuk egy Akkumultort feltltttsgi szintnek mint az Xt-t alkot
llapotvltozk egyiknek a felvtelvel. Ez segt a robot mozgsnak a jslsban, de ugyanakkor megkveteli
az Akkumultort jslst az Akkumultort1-bl s a sebessgbl. Bizonyos esetekben ez megbzhatan
megtehet; a pontossg azonban javulna egy, az akkumultor feltltttsgt mr j rzkel felvtelvel.
valamely f fggvnnyel. Ezt a folyamatot gyakran nevezik rekurzv becslsnek (recursive estimation).
Tekinthetjk a szmtst gy, mint ami valjban kt rszbl ll: elsknt a jelenlegi llapot eloszlst
terjesztjk elre t-rl t + 1-re; azutn fogjuk frissteni, felhasznlva az j et+1 bizonytkot. Ez a ktlpses
folyamat elg egyszeren alakul:
P(Xt+1|e1:t+1) = P(Xt+1|e1:t, et+1) (felosztva a bizonytkot)
= P(et+1|Xt+1, e1:t) P(Xt+1|e1:t) (a Bayes-szablyt hasznlva)
= P(et+1|Xt+1) P(Xt+1|e1:t) (a bizonytk Markov-tulajdonsga miatt)
Itt s vgig a fejezetben, az egy normalizcis konstans, ami a valsznsgek 1-re sszegzst biztostja. A
msodik tnyez P(Xt+1|e1:t) reprezentlja a kvetkez llapot egylpses elrejelzst, s az els tnyez ezt
frissti az j bizonytkkal. Vegyk szre, hogy P(et+1|Xt+1) kzvetlenl kinyerhet az rzkel modellbl. Most a
jelenlegi Xt llapotot felttelnek vve a kvetkez llapot egylpses elrejelzshez jutunk:
(kihasznlva
Markov-
tulajdonsgot)(15.3)
Az sszegzsen bell az els tnyez egyszeren az llapottmenet-modell s a msodik a jelenlegi llapot
eloszlsa. gy megvan a kvnt rekurzv kplet. A szrt P(Xt|e1:t) becslsre gy gondolhatunk, mint egy f1:t
477
Created by XMLmind XSL-FO Converter.
zenetre, amit elre terjesztnk vgig a sorozaton, minden tmenetnl az j megfigyelssel mdostva s
frisstve. A folyamat
f1:t+1 = Elre(f1:t, et+1)
Fontos
Ha az sszes llapotvltoz diszkrt, minden frissts ideje lland (azaz t-tl fggetlen), s a trigny
is lland. (Ezek az llandk termszetesen fggnek az llapottr mrettl s a trgyalt idbeli modell
konkrt tpustl.) A frissts id- s trignynek llandnak kell lennie, ha egy korltos memrij
gensnek kvetnie kell az aktulis llapot eloszlst a megfigyelsek egy korltlan sorozata esetn.
Mutassuk be a szrsi folyamatot kt lpsen keresztl az alap esernys pldban (lsd 15.2. bra). Feltesszk,
hogy a biztonsgi rnknek van valamilyen a priori hite, hogy a 0. napon esett-e, ppen azeltt, hogy a
megfigyelsek sorozata elkezddik. Tegyk fel, hogy ez P(R0) = 0,5, 0,5 . Most a kt megfigyelst a
kvetkezkppen dolgozzuk fel:
Az 1. napon az eserny feltnik, gy U1 = igaz. Az elrejelzs t = 0-rl t = 1-re
rzsnk szerint az es valsznsge azrt nvekedett az 1. naprl a 2. napra, mert az es folytatdik. A 15.2.
(a) feladat ennek a tendencinak a tovbbi vizsglatt kri.
Az elrejelzs feladatt tekinthetjk egyszeren szrsnek j bizonytk hozzadsa nlkl. Valjban a szrsi
folyamat mr magban foglal egy egylpses elrejelzst s knnyen szrmaztathat a kvetkez rekurzv
szmts a t + k + 1 llapot elrejelzsre a t + k elrejelzsbl:
478
Created by XMLmind XSL-FO Converter.
2.2. Simts
Ahogy korbban meghatroztuk, a simts (smoothing) mltbeli llapotok feletti eloszls kiszmtsnak a
folyamata a jelenig tart bizonytkok ismeretben; azaz P(Xk|e1:t) szmtsa valamely 0 k < t esetn (lsd
15.3. bra). Ez legknyelmesebben kt rszletben vgezhet el a bizonytk k-ig s a bizonytk k + 1-tl t-ig,
P(Xk|e1:t) = P(Xk|e1:k, ek+1:t)
= P(Xk|e1:k) P(ek+1:t|Xk, e1:k) (a Bayes-szablyt hasznlva)
= P(Xk|e1:k) P(ek+1:t|Xk) (a feltteles fggetlensget hasznlva)
= f1:k bk+1:t (15.6)
ahol definiltuk a bk+1:t = P(ek+1:t|Xk) visszafel zenetet, analg mdon az f1:k elre zenethez. Az f1:k elre
zenetet elre szrssel lehet kiszmolni 1-tl k-ig, a (15.3) egyenlet alapjn. A bk+1:t visszafel zenetrl pedig
kiderl, hogy egy egyszer rekurzv folyamattal kiszmthat, ami t-tl visszafel halad:
ahol az utols lps az ek+1 s az ek+2:t feltteles fggetlensgbl kvetkezik az xk+1 melletti felttellel. Az
sszegzsben a hrom tnyezbl az els s a harmadik kzvetlenl a modellbl megkaphat, a msodik pedig a
rekurzv hvs. Az zenetjellst hasznlva kapjuk, hogy
bk+1:t = Htra(bk+2:t, ek+1:t)
ahol a HTRA a (15.7) egyenlet ltal lert frisstst hajtja vgre. Ahogy az elrefel rekurzinl, az egyes
frisstsekhez szksges id- s trigny lland, s gy t-tl fggetlen itt is.
479
Created by XMLmind XSL-FO Converter.
Most lthatjuk, hogy a (15.6) egyenlet mindkt tnyezje kiszmthat idbeli rekurzival, az egyik elrefel fut
1-tl k-ig, s a szrs (15.3) egyenlett hasznlja, a msik visszafel fut t-tl k+1-ig, s a (15.7) egyenletet
hasznlja. Figyeljnk arra, hogy a viszszafel fzist bt+1:t = P(et+1:t|Xt) = 1-gyel inicializljuk, ahol 1 egy
egyesekbl ll vektor. (Mivel et+1:t egy res sorozat, a megfigyelsnek valsznsge 1.)
Alkalmazzuk most ezt az algoritmust az esernys pldra, kiszmtva az es valsznsgnek simtott becslst
t = 1-nl, az els s msodik nap megfigyelseinek ismeretben. A (15.6) egyenlet szerint ezt az adja meg, hogy
P(R1|u1, u2) = P(R1|u1) P(u2|R1) (15.8)
A korbban lert elrefel szrsi folyamatbl mr tudjuk, hogy az els tnyez 0,818, 0,182 . A msodik
tnyezt a (15.7) egyenletbeli visszafel rekurzit alkalmazva szmthatjuk ki:
Ezt visszahelyettestve a (15.8) egyenletbe azt kapjuk, hogy a simtott becsls az esre az 1. napon
P(R1|u1, u2) = 0,818, 0,182 0,69, 0,41 0,883, 0,117
gy ebben az esetben a simtott becsls nagyobb, mint a szrt becsls (0,818). Ennek oka az, hogy az eserny a
2. napon valsznbb teszi, hogy esett a 2. napon, s mivel az es tartsan szokott esni, ez mg valsznbb
teszi, hogy esett az 1. napon.
Mind az elrefel, mind a visszafel halad rekurzi lpsenknt lland idt ignyel; gy a simts
idkomplexitsa e1:t bizonytk esetn O(t). Ez egy konkrt k idlpsbeli simts komplexitsa. Ha a teljes
szekvencit szeretnnk simtani, nyilvnval mdszer, hogy egyszeren az egsz simtsi folyamatot lefuttatjuk
minden egyes simtand idpillanatra. Ez O(t2) idkomplexitst eredmnyez. Jobb megkzelts a dinamikai
programozs nagyon egyszer alkalmazsval O(t)-re cskkenti a komplexitst. A megolds kulcsa megjelent
az esernys plda elz elemzsben, ahol az elrefel szrs folyamatnak eredmnyeit jra fel tudtuk
hasznlni. A lineris idej algoritmus kulcsa gy az elrefel szrs eredmnyeinek a trolsa az egsz
sorozatnl. Aztn a visszafel rekurzit futtatjuk t-tl 1-ig, kiszmtva a szrt becslst minden k lpsnl a
kiszmolt bk+1:t visszafel zenetbl s a trolt f1:k elrefel zenetbl. Az algoritmus, amit tallan elre-htra
algoritmusnak (forward-backward algorithm) neveznek, a 15.4. brn lthat.
A figyelmes olvas szrevehette, hogy a 15.3. brn lthat Bayes-hlstruktra egy polifa (polytree) a 14.
fejezet szhasznlatban. Ez azt jelenti, hogy a csoportost algoritmus egy nyilvnval alkalmazsa szintn
lineris idej algoritmust eredmnyez, ami a teljes sorozatra kiszmtja a simtott becslst. Mra mr vilgoss
480
Created by XMLmind XSL-FO Converter.
vlt, hogy az elre-htra algoritmus valjban a csoportost eljrsokban hasznlt polifa terjesztsi
algoritmusnak egy specilis esete (br a kettt egymstl fggetlenl fejlesztettk ki).
Az elre-htra algoritmus alkotja a gerinct azon szmtsi mdszereknek, amelyeket szmos zajos
megfigyelsek sorozatval foglalkoz alkalmazsban hasznlnak, a beszdfelismerstl a replgpek
radarkvetsig. Ahogy lertuk, kt gyakorlati htrnya van. Az els, hogy a trignye tl nagy lehet azoknl az
alkalmazsoknl, ahol az llapottr nagy, s a sorozatok hosszak, mivel O(|f|t) mret trat hasznl, ahol |f| az
elrefel zenet reprezentcijnak a mrete. A trigny O(|f|log t)-re cskkenthet az idkomplexitsnak egy
log t tnyezvel trtn egyidej megnvelse rn, ahogy a 15.3. feladat mutatja. Bizonyos esetekben (lsd
15.3. alfejezet) egy lland trigny algoritmus hasznlhat idbntets nlkl.
Az alapalgoritmus msodik htrnya, hogy a folyamatos (online) mkdshez mdostst ignyel. Ekkor
ugyanis a korbbi idpontokhoz simtott becslseket kell kiszmtanunk, amint folyamatosan j megfigyelsek
rkeznek a sorozat vghez. A leggyakoribb kvetelmny az lland idklnbsg simts (fixed-lag
smoothing), ami a P(Xtd|e1:t) simtott becsls kiszmtst jelenti egy rgztett d-re. Azaz a simtst a jelenlegi t
idpillanat eltt d lpssel lv idpontra vgezzk el; t nvekedst a simtsnak is kvetnie kell. Nyilvnval,
hogy lefuttathatjuk az elre-htra algoritmust a d lpses ablakban, amint egy j bizonytk addik, de ez nem
tnik hatkonynak. A 15.3. alfejezetben ltni fogjuk, hogy az lland idklnbsg simtsnl egy frissts
bizonyos esetekben lland id alatt megtehet, fggetlenl a d idklnbsgtl.
Fontos
Mskppen fogalmazva, van egy rekurzv kapcsolat az xt+1 llapotokba vezet legvalsznbb
tvonalak s az xt llapotokba vezet legvalsznbb tvonalak kztt. Ez a kapcsolat olyan
egyenletknt rhat fel, amely az tvonalak valsznsgeit kapcsolja ssze:
481
Created by XMLmind XSL-FO Converter.
15.5. bra - (a) Az Est lehetsges llapotsorozatait tekinthetjk egy tvezet tnak egy
grfon, aminek csompontjai a lehetsges llapotok az egyes idpontokban. (Az
llapotokat ngyzetes csompont jelzi, hogy flrerthetetlenl megklnbztessk ket
egy Bayes-hl csompontjaitl.) (b) A Viterbi-algoritmus mkdse az [igaz, igaz,
hamis, igaz, igaz] megfigyelsi sorozatra. Minden t idpontra feltntettk az m1:t zenet
rtkeit, ami minden egyes t idpontbeli llapothoz megadja a legjobb, benne vgzd
sorozat valsznsgt. Minden egyes llapothoz egy vastag nyl is vezet, ami a legjobb
eldjt jelzi, a megelz sorozat valsznsgnek s az tmenet valsznsgnek a
szorzata szerint. A vastag nyilak visszafel kvetse az m1:5-beni legvalsznbb
llapotbl pedig megadja a legvalsznbb sorozatot.
3. Rejtett Markov-modellek
Az elz fejezet idbeli valsznsgi kvetkeztetsre szolgl algoritmusokat vezetett be egy ltalnos
keretben, ami fggetlen volt az llapottmenet- s az rzkel modellek specilis formjtl. Ebben s a
482
Created by XMLmind XSL-FO Converter.
Azaz Tij az tmenet valsznsge i-bl j-be. Pldul az esernys vilgban az llapottmenet-mtrix
Az rzkel modellt szintn mtrixalakra hozzuk. Ebben az esetben mivel az Et bizonytkvltoz rtke ismert,
mondjuk et, gy a modellnek csak azt a rszt hasznljuk, ami az et megjelensnek valsznsgt
meghatrozza. Minden t idpontra konstrulunk egy Ot diagonlis mtrixot, aminek az tlbeli elemeit a P(et|Xt
= i) rtkek adjk, a tbbi rtke pedig 0. Pldul az esernys vilgban az 1. napon az U1 = igaz, gy a 15.2. bra
szerint azt kapjuk, hogy
Most oszlopvektort hasznlva az elre s htra zenetek reprezentlsra, a szmtsok egyszer mtrix-vektor
mveletekk vlnak. A (15.3) elrefel egyenlet ekkor
f1:t + 1 = Ot
+ 1
T f1:t (15.10)
Ezekbl az egyenletekbl lthat, hogy az elre-htra algoritmus (lsd 15.4. bra) idkomplexitsa egy t
hosszsg sorozatra trtn alkalmazsnl O(S2t), mivel minden lps egy S elem vektor szorzst ignyli egy
S S mtrixszal. A trigny pedig O(St), mivel az elrefel fzis t darab S mret vektort trol el.
Amellett hogy a mtrixos jells az RMM-ek esetben a szrs s a simts algoritmusaira egy elegns
lersmdot knl, ez javtott algoritmusokra is jelez lehetsgeket. Az els az elre-htra algoritmus egy
egyszer vltozata, ami simts elvgzst teszi lehetv lland trigny mellett, a sorozat hossztl
fggetlenl. Az tlet az, hogy egy konkrt k idpillanatban a simts mind az f1:k elre, mind a bk+1:t htra
zenetek egyidej jelenltt ignyli a (15.6) egyenlet szerint. Az elre-htra algoritmus ezt gy biztostja, hogy
az elrefel fzisban trolja az f-eket, hogy a htrafel fzisban elrhetk legyenek. Egy msik mdszer szerint
ez gy rhet el, hogy egyetlen menetben mind f-et, mind b-t ugyanabban az irnyban terjesztjk. Pldul az f
elre zenet terjeszthet htrafel, ha trendezzk a (15.10) egyenletet, hogy a msik irnyban mkdjn:
A vektor- s mtrixmvelekben jratlan olvas szmra hasznos lehet az A) fggelket tnzni, mieltt a fejezetben tovbbhaladna.
483
Created by XMLmind XSL-FO Converter.
A mdostott szrsi algoritmus gy mkdik, hogy elszr lefut egy szabvnyos elre fzis, kiszmtva ft:t-t
(elfelejtve az sszes kzbens eredmnyt), majd lefut egy visszafel fzis egytt b-re s f-re, kiszmtva a
simtott becslst minden idpontban. Mivel mindegyik zenetnek csak egy pldnya szksges, a trigny
lland (azaz fggetlen t-tl, a sorozat hossztl). Az algoritmusra egyetlen jelents megkts vonatkozik: az
llapottmenet-mtrixnak invertlhatnak kell lennie, s az rzkel modellben nem lehetnek nullk azaz
minden megfigyelsnek lehetsgesnek kell lenni minden llapotban.
A msodik terlet, ahol a mtrixjells javtst jelez, a menet kzben trtn (online) simts lland
idklnbzettel. Az a tny, hogy a simts elvgezhet lland trignnyel azt jelzi, hogy lteznie kell egy
hatkony rekurzv algoritmusnak menet kzbeni simtsra azaz olyan algoritmusnak amelynek az
idkomplexitsa fggetlen az idklnbzet hossztl. Tegyk fel, hogy az idklnbzet d; azaz a simtst t
d idpontban vgezzk, ahol t a jelenlegi idpont. A (15.6) egyenlet szerint ki kell szmolnunk a t d idpontra
az
f1:td btd+1:t
rtket. Hogyan tehet ez meg inkrementlisan? Elszr is, az f1:td+1 kiszmthat az f1:td-bl a szabvnyos
szrs mvelett hasznlva a (15.3) egyenlet szerint.
A visszafel zenet inkrementlis kiszmtsa trkksebb, mivel nincs egyszer kapcsolat a rgi btd+1:t
visszafel zenet s az j btd+2:t+1 visszafel zenet kztt. Ehelyett, a rgi btd+1:t visszafel zenet s a sorozat
kezd bt+1:t visszafel zenete kztti kapcsolatot fogjuk megvizsglni. Ennek elrshez alkalmazzuk a (15.11)
egyenletet d alkalommal, s azt kapjuk, hogy
ahol a Btd+1:t mtrix a T s az O mtrixok sorozatnak a szorzata. A B-t felfoghatjuk egy transzformcis
opertornak, ami egy ksbbi visszafel zenetet egy korbbiba alakt. Egy hasonl egyenlet ll fenn az j
visszafel zenetekre a kvetkez megfigyels berkezse utn:
Ha a (15.12) s a (15.13) egyenletben megvizsgljuk a szorzatokat, lthatjuk, hogy egyszer kapcsolat van
kzttk: a msodik szorzathoz el kell osztani az els szorzatot TOtd+1-gyel, s megszorozni az j utols
elemmel TOt+1-gyel. Mtrixjellssel ekkor a rgi s az j B mtrixok kztt egy egyszer kapcsolat van:
Ez az egyenlet a B mtrix egy inkrementlis frisstst adja, amely viszont (a (15.3) egyenlet ltal) lehetv teszi
az j btd+2:t+1 visszafel zenet kiszmtst. A teljes algoritmus, ami az f s B trolst s frisstst ignyli, a
15.6. brn lthat.
484
Created by XMLmind XSL-FO Converter.
4. Kalman-szrk
Kpzeljnk el egy kismadarat, amint a dzsungel srjben repl szrkletkor: a mozgsnak csupn rvid,
szakaszos felvillansait pillanthatjuk meg; minden igyekezetnkkel azt prbljuk megjsolni, hogy hol van most
a madr, s legkzelebb hol fog felbukkanni, hogy nehogy szem ell tvesszk. Vagy kpzeljk azt, hogy a
msodik vilghborban radarkezelk vagyunk, egy gyenge, mozg radarjelet kmlelve, ami 10
msodpercenknt jelenik meg a kpernyn. Vagy, kiss mg tvolabbra visszalpve, kpzeljk magunkat Kepler
helybe, ahogy a bolygk mozgst prblja rekonstrulni igen pontatlan szgmrsek sokasgbl, amit
rendszertelen s pontatlanul mrt intervallumokban rgztettek. Mindegyik esetben egy fizikai rendszer llapott
prbljuk megbecslni (helyet s sebessget pldul) idben egymst kvet zajos megfigyelsekbl. A
problmt megfogalmazhatjuk egy idbeli valsznsgi modellben val kvetkeztetsknt, ahol az
llapottmenet-modell a mozgs fizikjt rja le, az rzkel modell pedig a mrsi folyamatot. Ez a fejezet
azokat a specilis reprezentcikat s kvetkeztetsi algoritmusokat vizsglja, amelyeket ilyen tpus
problmkra fejlesztettek ki; a trgyalt eljrst Kalman-szrsnek (Kalman filtering) nevezik, a kidolgozja
Rudolf E. Kalman4 utn.
Vilgos, hogy tbb folytonos vltozra lesz szksgnk a rendszer llapotnak megadshoz. Pldul a madr
replse megadhat egy (X, Y, Z) pozcival s egy (X, Y, Z) sebessggel minden egyes idpillanatban.
Szksgnk lesz mg alkalmas feltteles srsgfggvnyekre az llapottmenet- s rzkel modellekhez; a
14. fejezethez hasonlan, lineris Gauss-eloszlsokat (linear Gaussian) fogunk hasznlni. Ez azt jelenti, hogy
a kvetkez Xt+1 llapot a jelenlegi Xt llapot lineris fggvnye, amihez mg egy Gauss-zaj addik, amely
felttel a gyakorlatban igen elfogadhatnak bizonyul. Tekintsk pldul a madr X koordintjt, pillanatnyilag
figyelmen kvl hagyva a tbbi koordintt. Legyen a megfigyelsek kztti intervallum , s ttelezznk fel
lland sebessget; ekkor a pozci frisstsre az addik, hogy
Az Xt pozci s
sebessgvektorok alkotta rendszerhez tartoz Bayes-hlstruktra a 15.7. brn lthat.
Vegyk szre, hogy ez a lineris Gauss-modellnek egy nagyon specilis alakja; az ltalnos alakot a fejezetben
4
485
Created by XMLmind XSL-FO Converter.
ksbb rjuk le, ami alkalmazsok nagyon szles krt fedi le az els bekezds egyszer mozgsos pldin tl.
Az olvasnak hasznos lehet az A) fggelkben tnzni a Gauss-eloszlsok egyes matematikai tulajdonsgait; a
jelenlegi cljainkhoz a legfontosabb, hogy egy tbbvltozs Gauss-eloszlst (multivariate Gaussian) d
vltoz esetn egy d elem tlag s egy d d-s kovarianciamtrix ad meg.
szintn Gauss-eloszls.
2. Ha az elrejelzs P(Xt+1|e1:t) eloszlsa Gauss-eloszls s a P(et+1|Xt+1) rzkel modell lineris Gauss-modell,
akkor az j bizonytkkal, mint felttellel, a frisstett eloszls
P(Xt+1|e1:t+1) = P(et+1|Xt+1)P(Xt+1|e1:t) (15.16)
szintn Gauss-eloszls.
gy a Kalman-szrs ELRE mvelete fogad egy t tlaggal s t kovarianciamtrixszal meghatrozott f1:t Gauss
elre zenetet, s elllt egy j tbbvltozs f t Gauss elre zenetet t+1 tlaggal s t+1 kovarianciamtrixszal.
gy, ha egy f1:0= P(X0) = N(0, 0) Gauss-eloszlssal indulunk, egy lineris Gauss-modellel val szrs az
llapotokon Gauss-eloszlst eredmnyez minden idpontban.
1: +1
486
Created by XMLmind XSL-FO Converter.
Fontos
Ez tetszets s elegns eredmnynek tnik, de mirt is olyan fontos? Ennek a magyarzata az, hogy a
most trgyalt esethez hasonl nhny specilis esetet kivve, a szrs folytonos vagy hibrid (diszkrt s
folytonos) hlkkal olyan llapoteloszlsokat generl, amelyek reprezentcija az idvel korltlanul
n. Ezt az lltst ltalban nem knny bizonytani, de a 15.5. feladat egy egyszer pldn mutatja be,
hogy mi trtnik.
szrsngyzettel:
(Az egyszersg kedvrt ebben a fejezetben ugyanazt az szimblumot fogjuk hasznlni minden
normalizcis lland jellsre.) Az llapottmenet-modell egyszeren a jelenlegi llapot egy Gauss-eloszls
mdostst jelenti lland
szrsngyzettel:
szrsngyzettel:
Most, az a priori P(X0) eloszls ismeretben kiszmthatjuk az egylpses elrejelzs eloszlst felhasznlva a
(15.15) egyenletet:
Az integrl igen bonyolultnak nz ki. A tovbbhalads lehetsgt annak szrevtele jelenti, hogy a kitev kt
olyan kifejezs sszege, amelyek ngyzetesek x0-ban, s gy az maga is ngyzetes x0-ban. Egy egyszer trkk,
amit teljes ngyzett kiegsztsknt (completing the square) ismernk, lehetv teszi brmely
trst egy
ngyzetes tag s egy
tag az integrlbl kivihet, gy azt kapjuk, hogy
487
Created by XMLmind XSL-FO Converter.
Most az integrl pontosan egy Gauss-eloszls teljes tartomny feletti integrlja, ami egyszeren 1-et ad. gy
csupn a maradk tag maradt a ngyzetesbl.
A msodik kulcslps annak szrevtele, hogy a maradk tagnak x1-ben ngyzetesnek kell lennie; valban,
egyszersts utn azt kapjuk, hogy
488
Created by XMLmind XSL-FO Converter.
Most ismt kombinljuk a kitevket, s ngyzett egsztsk ki (15.6 feladat), azt kapva, hogy
A 15.8. brn lthat egy frisstsi ciklus az llapottmenet- s az rzkel modell konkrt rtkei esetn.
Az elz egyenletpr pontosan ugyanazt a szerepet jtssza, mint az ltalnos szrs egyenlete (15.3) vagy az
RMM-szrs egyenlete (15.10). A Gauss-eloszlsok specilis tulajdonsga miatt azonban az egyenleteknek van
nhny tovbbi rdekes tulajdonsga. Elszr is, hogy az j t+1 tlag kiszmtsa rtelmezhet gy, mint
egyszeren az j zt+1 megfigyels s a rgi t tlag slyozott tlaga. Ha a megfigyels megbzhatatlan, akkor
nagy, s tbb figyelmet szentelnk a rgi tlagnak; ha a rgi tlag megbzhatatlan ( t2 nagy), vagy a folyamat
nehezen megjsolhat (
hogy a
szrsngyzet frisstse fggetlen a megfigyelstl. Ezrt elre kiszmthatjuk, hogy mi lesz a
szrsngyzetrtkek sorozata. Harmadszor, a szrsngyzetrtkek sorozata gyorsan konvergl egy adott
rtkhez, ami csak
15.7. feladat).
-tl s
A kitevben lv tnyezk sszeszorzsa lthatv teszi, hogy a kitev is ngyzetes fggvnye az x-ben lv xi
valsznsgi vltozknak. Ahogy az egyvltozs esetben, a szrsi frissts megrzi az llapoteloszls gaussi
voltt.
Elsknt definiljuk a Kalman-szrsnl hasznlt ltalnos idbeli modellt. Mind az llapottmenet-modell,
mind az rzkel modell lineris transzformcit enged meg additv Gauss-zajjal. gy azt kapjuk, hogy
P(xt+1|xt) = N(Fxt, x)(xt+1)
P(zt|xt) = N(Hxt, z)(zt) (15.19)
489
Created by XMLmind XSL-FO Converter.
ahol a Kt+1 = (FtF + x)H (H(FtF + x)H + z)-1 mennyisg neve a Kalman-erstsmtrix (Kalman gain
matrix). Akr hihet, akr nem, ezeknek az egyenleteknek lehetsges egy szemlletes rtelmezse. Pldul,
gondoljuk meg a llapottlag-becsls frisstst. Az Ft tag a t+1 idpontban elre jelzett llapot, gy HFt az
elre jelzett megfigyels. Ezrt a zt+1 HFt tag az elre jelzett megfigyels hibjt reprezentlja. Ez van
megszorozva a Kt+1 tnyezvel az elre jelzett llapot korriglshoz; gy a Kt+1 annak mrtke, hogy mennyire
kell figyelembe venni az j megfigyelst az elrejelzshez kpest. Ahogyan a (15.18) egyenletben, az a
tulajdonsg most is fennll, hogy a szrsngyzet frisstse fggetlen a megfigyelstl. A t s a Kt rtkek
sorozata ezrt elre (offline) is kiszmolhat, s a kvets kzben szksges konkrt szmtsok igen
mrskeltek.
Hogy bemutassuk az egyenletek mkdst egy XY skon mozg trgy kvetsnek a problmjra
alkalmaztuk ket. Az llapotvltozk az
, gy az F, x, H s z 4 4-es mtrixok. A 15.9. (a)
brn lthat az igazi plyagrbe, a zajos megfigyelsek sorozata s a Kalman-szrssel becslt plyagrbe
vgig a kovariancival, amit az egysgnyi szrs mret krvonalak jeleznek. A szrsi folyamat jl teljest az
aktulis mozgs kvetsben, s ahogy vrhat, a szrsngyzet gyorsan bell egy rgztett rtkre.
Ahogyan szrsre, gy simtsra is szrmaztathatk egyenletek lineris Gauss-modell esetn. A simts
eredmnyei a 15.9. (b) brn lthatk. Vegyk szre, hogy a helyzetbecsls szrsngyzete gyorsan lecskken, a
plyagrbe vgt leszmtva (itt mirt nem?), s hogy a simtssal becslt plyagrbe sokkal egyenletesebb.
490
Created by XMLmind XSL-FO Converter.
A Kalman-szrs alkalmazhatsgnak tnye egy rendszerre nem jelenti, hogy az eredmnyek rvnyesek vagy
hasznosak lesznek. A feltevsek lineris Gauss-fle llapottmenet-modell s rzkel modell igen ersek.
A kiterjesztett Kalman-szr (KKSZ) (extended Kalman filter, EKF) megprbl rr lenni a modellezett
rendszer nemlineris tulajdonsgain. Egy rendszer nemlineris, ha az llapottmenet-modell nem rhat le, mint
az llapotvektor mtrixszorzata, ahogyan ez a (15.19) egyenletben szerepel. A KKSZ gy mkdik, hogy
rendszert xt-ben loklisan linerisknt modellezi az xt = t krnyezetben, ahol t a jelenlegi llapoteloszls
tlaga. Ez jl mkdik sima, j magaviselet rendszereknl, s lehetv teszi a kvetnek, hogy egy olyan
Gauss-llapoteloszlst tartson nyilvn s frisstsen, ami elfogadhat kzeltse az igazi a posteriori eloszlsnak.
Azonban mit is jelent, hogy egy rendszer nem sima vagy rossz magaviselet? Technikailag ez azt jelenti,
hogy jelents nemlinearits van jelen a rendszer viselkedsben abban a rgiban, ami kzel van a jelenlegi t
tlaghoz (a t kovarianciamtrix szerint). Ennek a tulajdonsgnak a nem technikai megrtshez gondoljunk arra
a pldra, amikor egy dzsungelben szll madr kvetsvel prblkoztunk. A madr nagy sebessggel
egyenesen egy fatrzs fel tart. A Kalman-szr, akr regulris, akr kiterjesztett a madr pozcijra, csak
Gauss-elrejelzst adhat, s ennek a Gaussnak az tlaga a fatrzs kzepre esik, ahogyan a 15.10. (a) brn
lthat. A madr egy elfogadhat modellje azonban egy elkerl mveletet jelezne elre egyik vagy msik
oldalra, ahogy az a 15.10. (b) brn lthat. Egy ilyen modell ersen nemlineris, mivel a madr dntse nagyon
eltr a fatrzshz vett pontos pozcijnak fggvnyben.
15.10. bra - Egy fa fel repl madr (fellnzetben). (a) Egy Kalman-szr
elrejelzse a madr helyzetre, ami egyetlen Gauss-eloszls az akadly kzepre
illesztve. (b) Egy valsghbb modell szmtsba veszi a madr elkerl manvereit, s
azt jelzi elre, hogy az egyik vagy a msik oldalon fog elszllni.
Ilyen pldk kezelshez nyilvnvalan egy kifejezbb nyelvre van szksgnk a modellezett rendszer
viselkedsnek a reprezentlshoz. A szablyozselmlet terletn, ahol olyan problmk, mint pldul egy
replgp elkerl manverezse ugyanilyen tpus bonyodalmakat vetnek fel, a megszokott megolds a vlt
Kalman-szr (switching Kalman filter). Ebben a megkzeltsben, tbb Kalman-szr fut prhuzamosan,
mindegyik a rendszer klnbz modelljt hasznlva pldul egy az egyenes replsre, egy az les balra
fordulsra s egy az les jobbra fordulsra. Az elrejelzseknek egy slyozott sszegt hasznljuk, ahol a sly
attl fgg, hogy mennyire illeszkednek az egyes szrk az aktulis adatokhoz. A kvetkez fejezetben ltni
fogjuk, hogy ez egyszeren az ltalnos dinamikus Bayes-hl modell egy specilis esete, amit a 15.7. brn
lthat hlbl egy diszkrt manver llapotvltoz hozzadsval nyernk. A vlt Kalman-szrket a 15.5.
feladat trgyalja tovbb.
5. Dinamikus Bayes-hlk
Egy dinamikus Bayes-hl vagy DBH (dynamic Bayesian network, DBN) egy olyan Bayes-hl, ami egy a
15.1. alfejezetben lert tpus idbeli valsznsgi modellt reprezentl. (Ahogy korbban is emltettk az index
idbeli rtelmezse helyett brmely szekvencilis rtelmezs lehetsges, gyakori pldul az indexnek mint egy
491
Created by XMLmind XSL-FO Converter.
egydimenzis helyzeti pozcinak az rtelmezse is a ford.) A DBH-kra mr lttunk pldkat, a 15.2. brn az
esernys hlt s a 15.7. brn a Kalman-szr hlt. ltalban egy DBH minden egyes szeletnek tetszleges
szm llapotvltozja (Xt) s bizonytkvltozja (Et) lehet. Az egyszersg kedvrt fel fogjuk tenni, hogy a
vltozk s kapcsolataik szeletrl szeletre pontosan ismtldnek, s hogy a DBH egy elsrend Markovfolyamatot reprezentl, gy minden vltoznak csak a sajt szeletben vagy a kzvetlenl megelz szeletben
lehetnek szlei.
Fontos
Nyilvnval, hogy minden rejtett Markov-modell reprezentlhat mint egy DBH, egyetlen
llapotvltozval s egyetlen bizonytkvltozval. Az is fennll, hogy minden diszkrt vltozs DBH
reprezentlhat mint egy RMM; ahogyan a 15.3. alfejezetben megmutattuk, a DBH sszes
llapotvltozja sszekombinlhat egyetlen llapotvltozv, aminek az rtkei az egyes
llapotvltozk rtkeinek az sszes lehetsges egyttese. Azonban ha minden RMM egy DBH, s
minden DBH tfordthat egy RMM-be, akkor mi a klnbsg? A klnbsg abban rejlik, hogy egy
komplex rendszer llapotnak az t alkot vltozkra trtn dekomponlsval a DBH kpes
kihasznlni az idbeli valsznsgi modell ritkasgt. Tegyk fel pldul, hogy egy DBH-nak 20
binris llapotvltozja van, amelyek mindegyiknek hrom szlje van az elz szeletben. Ekkor a
DBH llapottmenet-modellje 20 23 =160 valsznsgi rtket tartalmaz, mg a hozztartoz RMMnek 220 llapota s ezrt 240, azaz durvn egybilli tmenet-valsznsg rtke van az llapottmenetmtrixban. Ez legalbb hrom ok miatt is rossz: elszr, hogy az RMM maga sokkal tbb trat ignyel,
msodszor, hogy a hatalmas llapottmenet-mtrix az RMM-kvetkeztetst sokkal kltsgesebb teszi,
harmadszor, hogy ilyen hatalmas szm paramter megtanulsnak problmja a tiszta RMMmodelleket alkalmazhatatlann teszi nagy problmk esetn. A DBH-k s az RMM-ek kztti
kapcsolat nagyjbl analg a hagyomnyos Bayes-hlk s a teljes tblzatos egyttes eloszlsok
kztti kapcsolathoz.
Mr megmutattuk, hogy minden Kalman-szr reprezentlhat egy DBH-ban folytonos vltozkkal s lineris
Gauss feltteles eloszlsokkal (lsd 15.7. bra). Az elz fejezet vgn trgyaltak miatt azzal is tisztban kell
lenni, hogy nem minden DBH reprezentlhat egyetlen Kalman-szr modellel. Egy Kalman-szrnl az
aktulis llapoteloszls mindig egy egyedlll tbbvltozs Gauss-eloszls azaz egyetlen dudor egy
konkrt helyen. A DBH-k ezzel szemben tetszleges eloszlst kpesek modellezni. Szmos vals alkalmazsnl
ez a rugalmassg elengedhetetlen. Gondoljuk meg pldul a kulcsaim jelenlegi helyt. Lehetnek a zsebeimben,
az jjeli szekrnyen, a konyhapulton vagy a bejrati ajtban himbldzva. Egyetlen Gauss-dudornak, ami ezt az
sszes helyet magban foglalja, jelents valsznsget kell rendelni ahhoz, hogy a kulcsok az elszobban a
levegben vannak. A vals vilg olyan aspektusai, mint cltudatos gensek, akadlyok s zsebek
nemlinearitsokat vezetnek be, amelyek diszkrt s folytonos vltozk kombincijt ignylik, hogy egy
elfogadhat modellhez jussunk.
492
Created by XMLmind XSL-FO Converter.
15.11. bra - (a) Az esernys DBH-hoz tartoz a priori eloszls, az llapottmenetmodell s az rzkel modell megadsa. Az sszes kvetkez szelet feltevsnk szerint az
1. szelet msolata. (b) Egy XY skon val robotmozgshoz tartoz egyszer DBH.
A robotikban brki, aki egy kevs gyakorlattal rendelkezik a szmtgpes folyamatvezrlsben vagy az
automatikus rzkels ms eseteiben, rgtn tanskodik arrl a tnyrl, hogy a kis mennyisg mrsi hiba
gyakran a legkevsb fontos a problmk kztt. Ugyanis a valdi rzkelk elromlanak, s amikor egy
rzkel elromlik, akkor nem kld szksgszeren egy jelet azzal, hogy , egybirnt az adat, amit kldk,
egy halom zagyvasg. Ehelyett egyszeren kldi a zagyvasgot. A meghibsods legegyszerbb formjt
tmeneti hibnak (transient failure) nevezik, amikor az rzkel alkalmanknt elhatrozza, hogy valami
zagyvasgot kld. Pldul az akkumultor szintrzkeljnek lehet olyan szoksa, hogy nullt kld, amikor
valaki meglki a robotot, mg akkor is, ha az akkumultor teljesen fel van tltve.
Lssuk, mi trtnik, amikor egy tmeneti hiba bekvetkezik egy Gauss-hibamodellnl, ami nem tudja kezelni az
ilyen hibkat. Ttelezzk fel pldul, hogy a robot csendesen ldgl, s 20 egymst kvet mrs az
akkumultoron 5-t ad. Ezutn az akkumultormr idleges kiesse miatt a kvetkez mrs eredmnye
AMr21 = 0. Mire kell kvetkeztetnnk egy egyszer Gauss-hibamodellbl az Akkumultor21-gyel kapcsolatban.
A Bayes-szably szerint a vlasz fgg mind a P(AMr21 = 0|Akkumultor21) rzkel modelltl, mind a
P(Akkumultor21|AMr1:20) elrejelzstl. Ha egy nagy rzkelsi hiba valsznsge szignifiknsan kisebb,
mint az Akkumultor21 = 0-ba val tmenet valsznsge, mg ha ez utbbi nagyon valszntlen is, akkor az a
posteriori eloszls nagy valsznsget fog rendelni a lemerlt akkumultorhoz. Egy msodik nulla rtk
mrsi eredmny t = 22-nl ezt a konklzit majdnem biztoss teszi. Ha az tmeneti hiba aztn eltnik, s a
jelzett rtk visszall 5-re t = 23-tl, akkor az akkumultorszint becslse gyorsan vissza fog llni 5-re, szinte
varzstsre. Ezt az esemnysort mutatja be a 15.12. (a) bra fels grbje, ami az Akkumultort vrhat rtkt
mutatja id szerint egy diszkrt Gauss-hibamodellt hasznlva.
Szigoran vve egy Gauss-eloszls problematikus, mivel pozitv valsznsget rendel nagy negatv tltsi szintekhez. A bta-eloszls
gyakran jobb vlaszts az olyan vltozkra, amelyeknek tartomnya korltos.
5
493
Created by XMLmind XSL-FO Converter.
15.12. bra - (a) Fels grbe: az Akkumultort vrhat rtknek a plyagrbje egy
olyan megfigyelsi sorozatnl, ami csak 5-sket tartalmaz, kivve a 0-kat a t = 21 s a t
= 22 idpontokban, egy egyszer Gauss-hibamodell felhasznlsval. Als grbe: a
plyagrbe, amikor a megfigyelsek 0-val folytatdnak t = 21-tl. (b) Ugyanez a ksrlet
az tmenetihiba-modellel elvgezve. Vegyk szre, hogy az tmeneti hibt jl kezeli, de
a vgleges hiba tlzott pesszimizmust eredmnyez.
Fontos
A helyrells ellenre elfordul (t = 22-nl), hogy a robot meg van gyzdve, hogy az akkumultora
lemerlt; felteheten ekkor ki kell kldenie egy segtsg jelet, s le kell kapcsolnia. Sajnos a
tlegyszerstett rzkel modellje tvtra vezette. Hogyan lehet ezt kijavtani? Gondoljunk egy
ismers pldra az emberek mindennapos vezetsi gyakorlatbl: les kanyarokban vagy meredek
hegyeken nha felvillan az zemanyagtartly res figyelmeztet lmpa. A seglykr telefon
keresse helyett inkbb az szokott az ember eszbe jutni, hogy az zemanyagmr gyakran igen nagy
hibkat ad, amikor az zemanyag ltyg a tartlyban. A trtnet tanulsga a kvetkez: az rzkel
hibjnak helyes kezelshez a rendszer rzkel modelljnek tartalmaznia kell a meghibsods
lehetsgt.
Egy rzkel legegyszerbb hibamodellje egy bizonyos valsznsggel megengedi, hogy az rzkel teljesen
helytelen rtket adjon vissza, fggetlenl a vilg valdi llapottl. Pldul ha az akkumultormr 0-t
visszaadva hibzik, azt mondhatjuk, hogy
P(AMrt = 0|Akkumultort = 5) = 0,03
ami felttelezheten sokkal nagyobb, mint az a valsznsg, amit az egyszer Gauss-hibamodell rendelne
hozz. Hvjuk ezt az tmenetihiba-modellnek (transient failure model). Hogyan segt ez, amikor a 0 jelzssel
kerlnk szembe? Felttelezve, hogy az az elre jelzett valsznsg, hogy az akkumultor lemerlt, az eddigi
jelzsek alapjn sokkal kisebb, mint 0,03, akkor az AMr21 = 0 megfigyels legjobb magyarzata az, hogy az
rzkel idlegesen meghibsodott. Szemlletesen gy kpzelhetjk el a bizonyossgot az akkumultor
feltltttsgrl, mint aminek van egy bizonyos mennyisg tehetetlensge, ami segt rr lenni a mrjelzs
idleges zavarain. A 15.12. (b) bra fels grbjn lthat, hogy az tmenetihiba-modell kpes tmeneti hibkat
kezelni a bizonyossg katasztroflis vltozsai nlkl.
Ennyit ht az idleges zavarokrl. Mi a helyzet az rzkel lland meghibsodsval? Sajnos, az ilyenfajta
meghibsodsok tlsgosan is gyakoriak. Ha az rzkel hsz 5-s jelzst ad, amit hsz 0-s jelzs kvet, akkor
az elz bekezdsben lert tmenetihiba-modell azt fogja eredmnyezni, hogy a robot fokozatosan azt kezdi
hinni, hogy az akkumultora lemerlt, amikor valjban az is lehet, hogy az rzkel hibsodott meg. A 15.12.
(b) brn lthat als grbe mutatja a bizonyossg plyagrbt erre az esetre. A t = 25 idpontra 5 darab 0
jelzsre a robot meg van gyzdve, hogy az akkumultora res. Nyilvnval, hogy jobban szeretnnk, ha a
robot azt hinn, hogy az akkumultor mrje romlott el ha valban ez a valsznbb esemny.
494
Created by XMLmind XSL-FO Converter.
Nem meglep, hogy egy tarts hiba kezelshez szksgnk lesz egy tartshiba-modellre (persistent failure
model), ami lerja, hogyan mkdik az rzkel normlis krlmnyek kztt s meghibsods utn. Ennek
elrshez ki kell egsztennk a rendszer rejtett llapott egy tovbbi vltozval, mondjuk egy AMHibs-sal,
ami megadja az akkumultormr llapott. A hiba tarts megmaradst egy nyllal kell modellezni, ami az
AMHibs0-t az AMHibs1-hez kapcsolja. Ennek a megmaradsi nylnak (persistence arc) olyan FVT-je van,
ami minden idlpsben megengedi a meghibsodst egy kis valsznsggel, mondjuk 0,001-gyel, de lerja,
hogy ha egy rzkel elromlott, akkor az rossz is marad. Amikor az rzkel rendben van, akkor az AMr
rzkel modellje megegyezik az tmenetihiba-modellel; amikor az rzkel rossz, az AMr mindig 0,
fggetlenl az akkumultor aktulis tltttsgtl.
Az akkumultor rzkeljnek tartshiba-modellje a 15.13. (a) brn lthat. A teljestmnye kt adatsoron (az
idleges zavarjelnl s a tarts meghibsodson) a 15.13. (b) brn lthat. Szmos dolgot rdemes megfigyelni
ezeken a grbken. Elszr is, hogy az idleges zavarjelnl az rzkel hibjnak a valsznsge jelentsen
megemelkedik a msodik 0 jelzs utn, de azonnal visszaesik, ahogy egy 5-st megfigyelt. Msodszor, hogy
tarts hibnl az rzkel hibjnak a valsznsge gyorsan megemelkedik 1 kzelbe, s ott marad. Vgl,
hogy amikortl az rzkelt hibsnak hiszi, a robot csak azt ttelezheti fel, hogy az akkumultor normlis
sebessggel veszti el tltst, ahogy az E(Akkumultort|...) fokozatosan cskken szintje ezt mutatja.
Eddig csupn felletesen rintettk a komplex folyamatok reprezentlsnak problmjt. Az llapottmenetmodellek vltozatossga risi, magban foglalva egymstl olyan tvol es tmkat, mint pldul az emberi
endokrin rendszer (hormonlis mkds) s az autplykon kzleked jrmvek modellezst. Az rzkel
modellezs egymagban is hatalmas terlet, de mg az olyan nehezen megfoghat jelensgek, mint pldul az
rzkel ellltdsa, hirtelen dekalibrlsa s a kls krlmnyeknek (mint az idjrsnak) a hatsai az
rzkel jelzsein is kezelhetk explicit reprezentcikkal a dinamikus Bayes-hlknl.
Sajnos a kibonts naiv alkalmazsa nem volna valami hatkony. Ha szrst vagy simtst szeretnnk elvgezni
megfigyelsek e1:t hossz sorozatn, akkor a kibontott hl trignye O(t) lenne, s korlt nlkl nne, amint
mg tbb megfigyelst adnnk hozz. Radsul ha egyszeren jra lefuttatjuk a kvetkeztet algoritmust
minden idpontban, amikor megfigyels rkezik, a kvetkeztetsi ideje frisstsenknt szintn O(t) szerint fog
nvekedni.
A 15.2. alfejezetre visszatekintve ltjuk, hogy lland id- s trigny elrhet a szrsi frisstsnl, ha a
szmtsok rekurzv mdon vgezhetk. Lnyegben a szrsi frissts (15.3) egyenlete az elz idponthoz
tartoz llapotvltozk kisszegzst (summing out) vgzi el, hogy megkapja az j idponthoz tartoz eloszlst.
Vltozk kisszegzse pedig pontosan az, amit a vltozeliminls (variable elimination) algoritmusa elvgez
(lsd 14.10. bra), s megmutathat, hogy a vltoz eliminls idrendi vltozkon futva pontosan a szrs
rekurzv frisstsnek (15.3) egyenlet szerinti mkdst utnozza. A mdostott algoritmus egyszerre legfeljebb
kt szeletet tart a memriban: kezdve a 0. szelettel, hozzadjuk az 1. szeletet, kisszegezzk a 0. szeletet, aztn
hozzadjuk a 2. szeletet, aztn kisszegezzk az 1. szeletet s gy tovbb. Ezzel a mdszerrel elrhet az lland
id- s trigny a szrsi frisstsnl. (Ugyanez a teljestmny elrhet az egyestsi fa algoritmusnak
megfelel mdostsaival.) A 15.10. feladat kri ennek a tnynek az ellenrzst az esernys hlra.
Eddig tartottak a j hrek, most kvetkeznek a rosszak: megmutathat, hogy egy frissts id- s
trkomplexitsnak az llandja majdnem minden esetben exponencilis az llapotvltozk szmban. Az
trtnik ugyanis, hogy amint a vltoz eliminls halad, a tnyezk megnnek, magukban foglalva az sszes
llapotvltozt (vagy pontosabban azokat az llapotvltozkat, amelyeknek van szljk az elz idszeletben).
A maximlis tnyezmret O(dn+1), a frissts kltsge pedig O(dn+2).
Fontos
Termszetesen ez sokkal kevesebb, mint az RMM frisstsnek kltsge, ami O(d2n), de nagyszm
vltoznl mg mindig kivitelezhetetlenl nagy. Ezt a slyos tnyt nehz elfogadni. Ugyanis a
kvetkezt jelenti: annak ellenre, hogy a DBH-k felhasznlhatk olyan nagyon komplex idbeli
folyamatok reprezentlsra, amelyek szmos, ritkn sszekapcsolt vltozval rendelkeznek, nem
vagyunk kpesek hatkonyan s pontosan kvetkeztetni ezekrl a folyamatokrl. A DBH-modell, ami
az sszes vltoz feletti a priori egyttes eloszlst reprezentlja, faktorizlhat az t alkot FVT-kre, de
az a posteriori egyttes eloszls a megfigyelsi szekvencin vett felttellel azaz az elre zenet
ltalban mr nem faktorizlhat. Eddig senki sem tallt megoldst erre a problmra, annak ellenre,
hogy megoldst a tudomny s mrnki tervezs fontos terletei tudnk nagyon jl hasznostani. gy
kzelt mdszerekre kell szortkoznunk.
Fontos
Emlkezznk vissza, hogy a valsznsgi slyozs a mkdse sorn a nem bizonytkvltozkat
mintavtelezi azok topolgiai sorrendjben, minden mintt azzal a valsznsggel slyozva,
amennyire egyezik a megfigyelt bizonytkvltozkkal. Ahogyan az egzakt kzelt algoritmusok
esetben is, a valsznsgi slyozst kzvetlenl alkalmazhatnnk egy kibontott DBH-ra, de
ugyanazok a problmk jelentkeznnek, nevezetesen, hogy a megfigyelssorozat nvekedsvel a
frisstsenknti id- s trigny nvekedne. A problma az, hogy az alapalgoritmus az egyes mintkat
egyms utn sorban vgigfuttatja a hl teljes hosszban. Ehelyett egyszeren az sszes N mintt
egytt futtathatnnk a DBH-n keresztl, szeletenknt egyszerre haladva. (Azaz a mintavteleket az
jragenerls kltsgnek elkerlse miatt nyilvntartannk s fokozatosan frisstennk a ford.) A
mdostott algoritmus illeszkedik a szrsi algoritmus ltalnos mintjhoz, az N mintval mint
elrefel zenettel. Az els kulcsgondolat az, hogy ekkor a mintkat magukat hasznljuk az
llapoteloszls egy kzelt reprezentcijaknt. Ez eleget tesz a frisstsenknti lland
idignynek, br az lland rtke a mintk szmtl fgg, aminek elg nagynak kell lenni a valdi a
posteriori eloszls elfogadhat kzeltshez. Szintn nincs szksg a DBH kibontsra, mivel csak az
aktulis s a kvetkez szeletet kell memriban tartani.
A valsznsgi slyozs trgyalsakor a 14. fejezetben rmutattunk, hogy az algoritmus pontossga leromlik,
ha a bizonytkvltozk lentebbiek a mintavtelezett vltozknl, mivel ekkor a mintk generlsra nincsen
hatssal a bizonytk. Egy DBH tipikus struktrjt megnzve mondjuk az esernys DBH-t a 15.14. brn
ltjuk, hogy a korai llapotvltozk mintavtelezsnl valban nem hasznosulnak a ksbbi bizonytkok.
Valjban, mg tzetesebben megnzve azt lthatjuk, hogy az llapotvltozk egyiknek sincs egyetlen
bizonytkvltoz sem az sei kztt! gy, br az egyes mintk slya fggeni fog a bizonytkoktl, a generlt
mintk aktulis halmaza teljesen fggetlen lesz a bizonytkoktl. Pldul mg ha a fnk mindennap el is
hozza az esernyjt, a mintavteli folyamat ekkor is hallucinlhat vget nem r knikult. A gyakorlatban ez
azt jelenti, hogy a mintk azon arnya, ami elfogadhatan kzel marad az esemnyek valdi sorhoz,
exponencilisan cskken t-vel, a megfigyels sorozat hoszszval; mshogy fogalmazva egy adott pontossgi
szint fenntartshoz, a mintk szmt exponencilisan nvelni kell t fggvnyben. Mivel egy vals idben
mkd szr algoritmus csak rgztett szm mintt tud hasznlni, a gyakorlatban az trtnik, hogy igen kis
szm frisstsi lps utn a hiba hatrtalanul megn.
Fontos
Vilgos, hogy jobb megoldsra van szksgnk. A msodik kulcsgondolat az, hogy a mintk halmazt
az llapottr nagy valsznsg rszeire koncentrljuk. Ez megtehet a megfigyelsek szerint nagyon
alacsony sly mintk eldobsval, mikzben megsokszorozzuk a nagy slyakat. Ezen a mdon a
mintk populcija elfogadhatan kzel marad a valsghoz. Ha gy gondolunk a mintkra, mint egy
eszkzre az a posteriori eloszls modellezshez, akkor van rtelme tbb mintt hasznlni az llapottr
azon rszeiben, ahol az a posteriori valsznsg nagyobb.
Az algoritmusok egy csaldjt, a rszecskeszrst (particle filtering) pontosan ennek elvgzsre terveztk. A
rszecskeszrs a kvetkezkppen mkdik: elszr egy N mintj populcit alkotunk a 0. idpontbeli P(X0)
a priori eloszls mintavtelezsbl. Ezutn minden idpontban egy frisstsi ciklus ismtldik:
Minden mintt elreterjesztnk mintavtelezve az xt+1 kvetkez llapot rtket feltve, hogy a minta aktulis
rtke xt adott, s felhasznlva a P(Xt+1|xt) llapottmenet-modellt.
Minden mintt slyozunk azzal a P(et+1|xt+1) valsznsggel, amit az j bizonytkhoz rendel.
A populcit jra mintavtelezzk, hogy egy N mintj j populcit generljunk. Minden j mintt a
jelenlegi populcibl vlasztunk ki; egy konkrt minta kivlasztsnak a valsznsge arnyos a slyval.
Az j mintk slyozatlanok.
Az algoritmus rszletesen a 15.15. brn lthat, s mkdst az esernys DBH esetn a 15.16. bra
szemllteti.
SLYOZOTT-MINTA-VISSZATTELLEL
mvelet
Megmutatjuk, hogy ez az algoritmus konzisztens gy helyes valsznsgeket ad, ahogy N a vgtelenbe tart
meggondolva, hogy mi trtnik egy frisstsi ciklus alatt. Feltesszk, hogy a mintapopulci a t idpontbeli f1:t
elre zenet egy helyes reprezentcijaknt indul. Az N(xt|e1:t) jellst hasznlva azon mintk szmra, amelyek
az e1:t megfigyelsek feldolgozsa utn az xt llapotban vannak, azt kapjuk, hogy
N(xt|e1:t) /N = P(xt|e1:t) (15.21)
498
Created by XMLmind XSL-FO Converter.
Most minden egyes mintt slyozunk a t + 1 idpontbeli bizonytk valsznsgvel. Egy xt+1 llapotban lv
minta P(et+1|xt+1) slyt kap. Az xt+1 llapotban lv mintk teljes slya az et+1 megfigyelse utn ezrt
W(xt+1|e1:t+1) = P(et+1|xt+1)N(xt+1|e1:t)
Most a mintavteli lps jn. Mivel minden egyes minta a slyval arnyos valsznsggel ismtldik, az
jramintavtelezs utn az xt+1 llapotban lv mintk szma arnyos az xt+1 llapotban lv mintk teljes
slyval az jramintavtelezs eltt:
Azaz a mintapopulci egy frisstsi ciklus utn helyesen reprezentlja a t + 1 idpontbeli elrefel zenetet.
A rszecskeszrs gy konzisztens, de hatkony-e? A gyakorlat azt mutatja, hogy a vlasz igen: a
rszecskeszrs, gy tnik, az igazi a posteriori eloszls egy j kzeltst tartja fenn lland szm mintt
hasznlva. Azonban jelenleg nincs elmleti garancia; a rszecskeszrs jelenleg aktvan kutatott terlet. Szmos
javtst s vltozatot javasoltak, s az alkalmazsok kre is egyre bvl. Mivel ez egy mintavtelez algoritmus,
a rszecskeszrs knnyen felhasznlhat hibrid s folytonos DBH-kban, lehetv tve az alkalmazst akr
olyan terleteken is, mint komplex mintzatok kvetse videofelvtelben (Isard s Blake, 1996) s tzsdei
elrejelzs (de Freitas s trsai, 2000).
6. Beszdfelismers
Ebben az alfejezetben az idbeli valsznsgi modellek egyik legfontosabb alkalmazst, a beszdfelismerst
(speech recognition) tekintjk t. A feladat egy beszl ltal elmondott szsorozat azonostsa az adott
akusztikus jelbl. A beszd az emberek kztti kommunikcinak a dominns modalitsa, s a megbzhat
szmtgpes beszdfelismers felmrhetetlenl fontos lenne. Mg ennl is hasznosabb volna a beszdmegrts
(speech understanding) az elhangzott beszd jelentsnek a meghatrozsa. Ennek trgyalsra a 22.
fejezetig kell vrnunk.
A beszd jelenti az els tallkozsunkat a valdi rzkelk szolgltatta adatok nyers, tiszttatlan vilgval. Ezek
az adatok zajosak, a sz szoros rtelmben: a zaj lehet httrzaj s lehet a digitalizlsi folyamat okozta
mellktermk; eltrsek lehetnek a szavak kiejtsi mdjban mg ugyanannl a beszlnl is; klnbz szavak
hangzsa ugyanaz lehet s gy tovbb. Ezen okok miatt a beszdfelismersre mint valsznsgi kvetkeztetsi
problmra kezdtek el tekinteni.
A legltalnosabb szinten a valsznsgi kvetkeztetsi problmt a kvetkezkppen definilhatjuk. Legyen a
Szavak egy valsznsgi vltoz az sszes lehetsges szszekvencia felett, ami elhangozhat, s legyen a jel a
megfigyelt akusztikusjel-szekvencia. Ekkor az elhangzottak legvalsznbb rtelmezse a Szavak azon rtke,
ami maximalizlja a P(szavak|jel) rtket. Amint az gyakori eset, a Bayes-szably alkalmazsa hasznos:
P(szavak|jel) = P(jel|szavak) P(szavak)
A P(jel|szavak) alkotjk az n. akusztikai modellt (acoustic model). Ez rja le a szavak hangzst a ceiling
(mennyezet)
egy
lgy
c-vel
kezddik
s
ugyangy
hangzik,
mint
a
sealing
(pecstels/tmts/fkavadszat). (Az azonos hangzs szavakat homofon (homophone) szavaknak
nevezzk.) A P(szavak) rtkei kpezik az n. nyelvi modellt (language model). Ez adja meg az a priori
valsznsgt minden egyes kijelentsnek pldul hogy a magas mennyezet (high ceiling) sokkal
valsznbb szkapcsolat, mint a magas pecstels (high sealing).
499
Created by XMLmind XSL-FO Converter.
A beszdfelismer rendszerekben hasznlt nyelvi modellek gyakran igen egyszerek. A fejezetben ksbb lert
bigram (bigram) modell minden lehetsges esetre megadja annak a valsznsgt, hogy egy sz egy msik
szt kvet. Az akusztikai modell sokkal bonyolultabb. Az alapjait egy fontos felfedezs alkotja a fonolgia
(phonology) (a nyelvi hangok tanulmnyozsa) terletrl, nevezetesen, hogy az emberisg minden nyelve egy
4050 hangbl ll korltos vlasztkkal l, amelyeket beszdhangoknak (phones) hvunk. Egy beszdhang
nagyjbl az a hang, amely egy egyedi mssal- vagy magnhangznak felel meg. A helyzetet kompliklja
valamelyest, hogy az olyan betkombincik, mint th vagy ng egyedi beszdhangot eredmnyeznek,
viszont egyes betk tbbfle beszdhanghoz vezetnek, a krnyezetktl fggen (pldul az a bet a rat s
a rate szban). Az angol nyelv sszes beszdhangja, pldkkal egytt, a 15.17. brn lthat. A fonma
(phoneme) a legkisebb hangi egysg, ami nll jelentssel br egy adott nyelv hasznli szmra. Pldul az
angolban a t beszdhang a stick szban ugyanaz a fonma, mint a t beszdhang a tick szban, de a thai
nyelvben ezek megklnbztethetk, mint kt klnbz fonma.
A beszdhangok ltezse lehetv teszi az akusztikai modell kt rszre bontst. Az els rsz a kiejtst
(pronunciation) kezeli, s minden egyes szra megad egy valsznsg-eloszlst az sszes lehetsges
beszdhangsor felett. Pldul a ceiling sz kiejtse [s iy l ih ng], vagy nha [s iy l ix ng], vagy esetleg [s iy l
en]. A beszdhangok kzvetlenl nem megfigyelhetk, gy nagyjbl a beszd egy olyan rejtett Markovmodellel reprezentlhat, aminek Xt llapotvltozja a t idpontban kimondott beszdhang.
Az akusztikai modell msodik rsze a beszdhangok akusztikus jelknt val megvalsulsi mdjval
foglalkozik: azaz a rejtett Markov-modell Et bizonytkvltozja adja meg az akusztikus jel t idpontban
megfigyelt jellemzit, s az akusztikus modell adja meg az P(Et|Xt) feltteles valsznsget, ahol Xt az aktulis
beszdhang. A modellnek lehetsget kell adni eltrsekre a hangmagassgban, a sebessgben s a hangerben,
s jelfeldolgozsi (signal processing) technikkon alapul, hogy olyan jelreprezentcit biztostson, ami
megfelelen robusztus mdon kezeli ezeket a fajta eltrseket.
15.17. bra - A DARPA fonetikus bc, avagy ARPAbet, amely az amerikai angolban
hasznlt beszdhangokat sorolja fel. Szmos alternatv felrs ltezik, kztk az
International Phonetic Alphabet (IPA), mely az sszes ismert nyelv beszdhangjt
tartalmazza.
A fejezet htralev rsze a modelleket s az algoritmusokat rja le lentrl felfel haladva, az akusztikus jelekkel
s a beszdhangokkal kezdve, majd az egyedi szavakkal s vgl teljes sorozatokkal folytatva. Befejezsl
ttekintjk, hogy ezek a modellek hogyan tanthatk, s mennyire mkdik jl a kapott rendszer.
6.1. Beszdhangok
500
Created by XMLmind XSL-FO Converter.
A hanghullmok olyan periodikus nyomsvltozsok, amelyek a levegben terjednek. A hang egy mikrofonnal
mrhet, aminek membrnjt elmozdtja a nyomsvltozs, s egy folytonosan vltoz ramot generl. Az
ramerssget ami a hanghullm amplitdjhoz tartozik egy analg-digitlis konverter mri diszkrt
idintervallumonknt a mintavteli frekvencia (sampling rate) szerint. Beszd esetn a tipikus mintavteli
frekvencia 8 s 16 kHz (azaz 8000-tl 16 000-ig msodpercenknt) kztt van. (J minsg zenei felvteleket
mintavteleznek 44 kHz vagy mg magasabb frekvencival.) A mrs pontossgt az egyes mintavteli
pontokban a kvantlsi tnyez (quantization factor) hatrozza meg; a beszdfelismerk tipikusan 812 bitet
hasznlnak. Ez azt jelenti, hogy a legkevsb ignyes rendszer, amely 8 kHz-es frekvencival mintavtelez, s 8
bites kvantlst hasznl, kzel fl megabjtot ignyel egy egyperces beszd trolshoz. Ilyen nagy mennyisg
jelinformci esetn kivitelezhetetlen ltrehozni s hasznlni a P(jel|beszdhang) eloszlsokat, gy az akusztikus
jelnek tmrebb lersait kell kifejlesztennk.
Elsknt azt vesszk figyelembe, hogy br a beszdben a hangfrekvencia akr tbb kHz-es is lehet, a jel
tartalmnak a megvltozsai sokkal ritkbban fordulnak el, taln nem tbb mint 100 Hz-cel. Ezrt a
beszdrendszerek a jel tulajdonsgait hosszabb idintervallumonknt, gynevezett keretenknt (frames)
sszegzik. Egy 10 ms-os (80 minta 8 kHz-es mintavtel mellett) keret elg rvidnek tnik ahhoz, hogy csak
nhny rvid idej jelensg mosdjon el az sszegzsi folyamat miatt. Az egyes kereteken belli folyamatot egy
jellemz (feature) vektorral brzoljuk. Pldul jellemezni akarjuk az energia szintjt szmos frekvenciasv
mindegyikben. Ms fontos jellemzk a keret globlis energiaszintje s a megelz kerettl szmtott
(energia)klnbsg. A jellemzk kiemelse a beszdjelbl hasonlt egy kicsit arra, ahogy a zenekar jtkt
figyelve megjegyezzk: Most a vadszkrtk hangosan s a hegedk halkan szlnak. A 15.18. brn lthatjuk
az talakts lpseit a nyers hangtl a keretek sorozatig. Figyeljk meg, hogy a keretek tlapoldnak; ez
megvd minket attl, hogy pont a keret hatrn fellp fontos akusztikus esemnyek informcijt elvesztsk.
A pldnkban csupn hrom jeggyel rendelkez keretet mutattunk. Vals rendszerek jellemzk tucatjaival vagy
akr szzaival dolgoznak. Pldul n darab jellemz esetn, amikor mindegyik 256 lehetsges rtket vehet fel,
egy keret egy ponttal adhat meg egy n-dimenzis trben, s 256n lehetsges keret ltezik. n > 2 esetn
kivitelezhetetlen volna a P(jellemzk|beszdhang) eloszlsnak egy explicit tblzatknt trtn brzolsa, gy
tovbbi tmrtsre van szksgnk. Kt lehetsges megkzelts ltezik:
A vektorkvantls (VK) (vector quantization, VQ) mdszere felosztja az n dimenzis teret mondjuk 256
partcira, C1-tl C256-ig cmkzve. Ekkor az egyes kereteket inkbb egy egyedi cmkvel, mint egy n
szmbl ll vektorral lehet jellemezni. gy a P(VQ|beszdhang) eloszls tblzatos formja 256
valsznsget tartalmaz minden egyes beszdhangra. Nagy rendszerekben a vektorkvantls mr nem
npszer.
A jellemzk ternek diszkretizlsa helyett parametrikus folytonos eloszlsokat hasznlhatunk a
P(jellemzk|beszdhang) lershoz. Pldul hasznlhatunk minden beszdhanghoz egy Gauss-eloszlst,
beszdhangonknt klnbz tlaggal s kovarianciamtrixszal. Ez jl mkdik, ha az egyes beszdhangok
akusztikus megvalsulsa a jellemzk terben egyetlen terleten csoportosul. A gyakorlatban egy hanghoz
tbb terleten val csoportosuls is tartozik, s Gauss-eloszlsok keverkt (mixture of Gaussians) kell
hasznlni. Egy keverk k egyedi eloszls slyozott sszege, gy a P(jellemzk|beszdhang) eloszlshoz k sly,
k n elem tlagvektor s k n2 mret kovarianciamtrix tartozik, ami O(kn2) paramter minden beszdhangra.
15.18. bra - Az akusztikus jel talaktsa keretek sorozatv; mindegyik keretet hrom
akusztikus jellemzvel runk le
501
Created by XMLmind XSL-FO Converter.
Termszetesen bizonyos informci elvsz a feldolgozs sorn, ami a teljes beszdjeltl egy VK cmkig vagy a
keverkparamterek egy halmazig tart. A jelfeldolgozs mvszete abban rejlik, hogy gy vlasszuk meg a
jellemzket s a tartomnyokat (vagy a Gauss-eloszlsokat), hogy a hasznos informci vesztesge minimlis
legyen. Egy adott beszdhang szmos mdon kiejthet: hangosan vagy halkan, gyorsan vagy lassan, magasan
vagy mly hangon, csendben vagy httrzajban s beszlk sok millija ltal, mindegyikjk klnbz
kiejtsvel s eltr hangkpz szerveivel.6
Mg kt tovbbi finomtst kell elvgeznnk az eddig lert egyszer modellen. Az els a beszdhangok idbeli
szerkezetvel foglalkozik. Normlis beszdben a legtbb beszdhangnak a terjedelme 50100 ezredmsodperc
vagy 510 keret. A P(jellemzk|beszdhang) valsznsgi modell ugyanaz ezen keretek mindegyikre, pedig a
legtbb beszdhangnak jelents bels struktrja van. Pldul a [t] egyike a zrhangoknak (stop consonants),
amelyekben a leveg ramlsa megsznik egy rvid idre egy hatrozott kibocsts eltt. Az akusztikus jelet
megvizsglva azt ltjuk, hogy egy [t]-nek a kezdete hangtalan, kzepn egy kis kirobbanssal s (ltalban) egy
sziszegssel a vgn. A beszdhangoknak ez a bels struktrja egy hromllapot modellel ragadhat meg;
minden beszdhangnak van egy kezdeti, kzp- s vgllapota, s minden llapotnak megvan a sajt eloszlsa a
jegyek felett.
A msodik finomts azzal a krnyezettel foglalkozik, amelyben a beszdhang elhangzik. Egy adott beszdhang
hangzst megvltoztathatjk a krnyez beszdhangok.7 Emlkezznk arra, hogy a beszdhangok az ajkak, a
nyelv s az lkapocs mozgsa s a levegnek a hangkpz szerveken trtn knyszertett tramlsa rvn
keletkezik. Ezen komplex mozgsok koordinlsnl, amik msodpercenknt t vagy mg tbb beszdhangot
produklnak, az agy mr akkor elindt a msodik beszdhanghoz tartoz mveletet, mieltt az els befejezdtt
volna, gy megvltoztatva az egyik vagy mindkt beszdhangot. Pldul a sweet (des) kiejtsnl az ajkak
kerektettek az [s] ellltsa kzben szmtva a kvetkez [w]-re. Ezeket a koartikulcis hatsokat
(coarticulation effects) rszlegesen megragadja a hrmashangz (triphone) modell, amelyben az egyes
beszdhangok akusztikai modellje fgghet az elz s kvetkez beszdhangtl. gy a [w] a sweet-ben gy
rhat, hogy [w(s,iy)], azaz [w] egy [s] bal- s egy [iy] jobb-krnyezetben.
A hromllapot s hrmashangz modellek egyttes hatsa megnveli az idbeli folyamat lehetsges
llapotainak a szmt az eredeti beszdhang kszletbeli n beszdhangrl 3n3-ra (az ARPAbet-ben n 50). A
tapasztalatok azt mutatjk, hogy a megnvelt pontossg bven ellenslyozza a kvetkeztets s a tanuls
megnvekedett kltsgeit.
6.2. Szavak
Minden egyes szra gondolhatunk gy, mint ami meghatroz egy kln P(X1:t|sz) valsznsgi eloszlst, ahol
Xi megadja az i-edik keretben a beszdhang llapott. Tipikusan ezt az eloszlst kt rszre osztjuk. A kiejtsi
modell (pronunication model) egy eloszlst ad meg a beszdhangsorok felett (figyelmen kvl hagyva az
temet s a kereteket), majd a beszdhangmodell (phone model) lerja, ahogyan a beszdhangok lekpzdnek
a keretek szekvencijra.
A dulis problma a beszlazonosts (speaker identification) pontosan ennek fordtottja, a kzs elemeket hagyja el, s az egyni
klnbsgeket tartja meg, majd megprblja a klnbsgeket az egyni beszdmodellekhez illeszteni.
7
Ebben az rtelemben a beszd beszdhangmodelljt inkbb hasznos kzeltsnek kell tekinteni, s nem megvltoztathatatlan trvnynek.
6
502
Created by XMLmind XSL-FO Converter.
Gondoljunk arra a szra, hogy tomato (paradicsom). Gershwin szerint ezt gy ejtik ki, hogy [t ow m ey t ow]
(Gershwin, 1937), n viszont gy ejtem, hogy [t ow m aa t ow]. A 15.19. bra fels rszn lthat egy olyan
llapottmenet-modell, ami gondoskodik errl a vltozatrl. A modellen keresztl csak kt t ltezik, egy, ami a
[t ow m ey t ow] beszdhang szekvencihoz tartozik, s a msik a [t ow m aa t ow] szekvencihoz. Egy t
valsznsge az tvonalat alkot nyilakon szerepl valsznsgek szorzata:
P([towmeytow]|tomato) = P([towmaatow]|tomato) = 0,5
503
Created by XMLmind XSL-FO Converter.
P(sz|e1:t) = P(e1:t|sz)P(sz)
A P(sz) a priori valsznsg valdi szveges adatbl kaphat meg. A P(e1:t|sz) pedig az akusztikus jegyek
sorozatnak a valsznsge a szmodell szerint. Ilyen valsznsgek kiszmtst a 15.2. alfejezet trgyalta;
nevezetesen a (15.15) egyenlet egy egyszer rekurzv szmtst definil, lineris kltsggel t-ben s a Markovlnc llapotainak szmban. A legvalsznbb sz megtallsnl ezt a szmtst minden lehetsges szra
elvgezhetjk, megszorozzuk az a priori valsznsggel, s e szerint vlasztjuk ki a legjobb szt.
6.3. Mondatok
Az emberi kommunikciban val rszvtelhez egy gpnek a folytonos beszdet (continuous speech) kell
felismernie, s nem pusztn egyedlll szavakat. Azt gondolhatnnk, hogy a folytonos beszd nem tbb, mint
szavak sorozata, amelyek mindegyikre alkalmazhatjuk az algoritmust az elz fejezetbl. Ez a megkzelts
kt ok miatt is buksra van tlve. Elszr is, mr lttuk (a 2.3. szakasz - A legvalsznbb sorozat megtallsa
rszben), hogy a legvalsznbb szavak sorozata nem a legvalsznbb egyttes szsorozat. Pldul a Take the
504
Created by XMLmind XSL-FO Converter.
Money and Run (Fogd a pnzt s fuss) c. filmben a banki alkalmazott flrerti Woody Allen irkafirka
bankrablsi zenett, s azt I have a gub (Nlam van a slukker)-nak olvassa (az I have a gun, vagyis Nlam
van a stukker helyett a ford.). Egy jobb nyelvi modell az I have a gun-t javasoln, mint aminek sokkal
nagyobb a valsznsge, mg ha a legutols sz inkbb gub-nak s nem gun-nak olvashat. A msodik
problma, amivel folytonos beszd esetn szembeslnnk kell, a szegmentls (segmentation) annak az
eldntse, hogy hol van egy sznak a vge, s hol kezddik a kvetkez. Mindenki, aki megksrelt egy idegen
nyelvet megtanulni, mltnyolni fogja a problma nehzsgt: elszr gy tnik, hogy a beszdben a szavak
egybefolynak, majd fokozatosan tanulunk meg egyedi szavakat kiemelni a hangok egyvelegbl. Ebben az
esetben az els benyoms korrekt: a spektrogrfiai elemzs azt mutatja, hogy a folyamatos beszdben a szavak
tnyleg sznetek nlkl kvetik egymst. A szavak hatrait annak ellenre tanuljuk meg megklnbztetni, hogy
a szavakat nem vlasztjk szt csendszakaszok.
Kezdjk a nyelvi modellel, aminek a beszdfelismersben az a feladata, hogy valsznsget rendeljen minden
egyes szsorozathoz. Legyen w1 wn az n szbl ll szsorozat, s legyen wi a szsorozat i-edik szava, akkor a
szsorozat-valsznsget az albbi mdon rhatjuk:8
Ezen kifejezsek tbbsge igen bonyolult s nehezen becslhet vagy szmthat. Szerencsre a kpletet
egyszerbb kifejezssel is kzelthetjk, mikzben a nyelvi modell zmt mgis megragadjuk. Az egyik
egyszer, kzkedvelt s hatkony eljrs a bigram (bigram) modell. Ez a modell a P(wi|w1... w 1)-et a P(wi|w 1)gyel kzelti. Ms szval, felttelezi, hogy a szsorozatokra teljesl az elsrend Markov-felttel.
i
A bigram modell nagy elnye, hogy a modell egyszeren tanthat az egyes szprok megszmolsval
szsorozatok egy reprezentatv korpuszban s a valsznsgek ezen szmok alapjn trtn megbecslsvel.
gy pldul, ha az a a mintakorpuszban 10 000-szer fordul el, s a gun azt 37-szer kveti, akkor P(guni|ai1)
= 3710 000, ahol a a becslt valsznsg. Az ilyen tants befejeztvel elvrnnk, hogy az I have s az a
gun valsznsge relatve magas legyen, az I has s az an gun valsznsge viszont alacsony. A 15.21.
bra a jelen knyv (eredeti angol nyelv kiadsnak) szavaibl szmtott nhny bigram gyakorisgt mutatja.
15.21. bra - Az unigram s bigram szmllknak egy rszleges tblzata a jelen knyv
(eredeti angol nyelv kiadsnak) szavai alapjn. A the a leggyakoribb egyedlll
sz 33 508 elfordulssal (513
893 sszes szbl). A leggyakoribb bigram
az of the, 3833 elfordulssal. Nhny szm nagyobb, mint vrhat (pldul 4-szer
fordul el az on is), mivel a bigram szmlls figyelmen kvl hagyja az elvlasztst:
egy mondat vgzdhet on-ra s a kvetkez kezddhet is-zel.
A modellt ki lehet bvteni trigramm (trigram), amely a P(wi|w 1w 2) mennyisgeket hasznlja. Ez egy
hatkonyabb nyelvi modell, kpes megadni, hogy az ate a banana (bannt ettem) valsznbb, mint az ate a
bandana (kendt ettem). A trigram modellben s kisebb mrtkben a bigram s unigram modellekben is
i
Valban jobb lenne, ha minden valsznsget egy adott helyzetre vonatkoz felttel mellett lehetne figyelembe venni. Kevs
beszdfelismer rendszer l ezzel a lehetsggel, mert nehz formlisan meghatrozni, hogy mi szmt adott helyzetnek.
8
505
Created by XMLmind XSL-FO Converter.
problmt jelentenek a nulla rtk szmllk: nem szeretnnk egy szkombincit lehetetlennek minsteni
pusztn azrt, mert nem fordulnak el a tant korpuszban. A simts (smoothing) folyamata ilyen
kombincikhoz egy kis, pozitv valsznsget rendel. Ezt a 1. szakasz - Valsznsgi nyelvi modellek
rszben trgyaljuk.
A bigram s trigram modellek nem annyira kifinomultak, mint a 22. s 23. fejezetben szerepl nyelvi modellek
nmelyike, de jobban tekintetbe veszik a helyi sszefggsek hatsait, s bizonyos helyi szintaxist sikeresen
kifejeznek. Pldul az a tny, hogy az I has s a man have szprok alacsony pontszmokat kapnak, az
alany-lltmny egyeztetst fejezi ki. A problma az, hogy ezeket a kapcsolatokat csak helyileg lehet szlelni:
the man have alacsony pontszmot kap, de a the man with yellow hat have nincs bntetve.
Most gondoljuk meg a nyelvi modell s a szmodellek egyestst, hogy minden szsorozatot megfelelen
tudjunk kezelni. Az egyszersg kedvrt egy bigram nyelvi modellt fogunk felttelezni. Egy ilyen modellel az
sszes szmodell (ami viszont kiejtsi s beszdhangmodellekbl ll) egyetlen nagy RMM-modellbe llthat
ssze. Az egy-szavas RMM-modell egy llapota egy keret, felcmkzve az aktulis beszdhanggal s
beszdhangllapottal (pldul [m]Kezdet); egy folytonos beszd RMM-ben egy llapot a szval is fel van
cmkzve, mint pldul
. Ha minden sznak tlagban p hromllapot beszdhang szerepel a kiejtsi
modelljben, akkor W sz esetn a folytonos beszd RMM-nek 3pW llapota van. tmenetek
bekvetkezhetnek egy adott beszdhangon bell a beszdhang llapotai kztt, egy adott sz beszdhangjai
kztt, illetve egy sz utols llapota s egy msik sz kezd llapota kztt. A szavak kzti tmenetek a
bigram modell szerinti valsznsggel kvetkeznek be.
Ha ellltottuk az egyestett RMM-modellt, akkor a felhasznlsval elemezhetjk a folytonos beszdjelet.
Klnsen a (15.9) egyenletben megadott Viterbi-algoritmusnak vehetjk hasznt a legvalsznbb
llapotsorozat megtallsban. Ebbl az llapotsorozatbl mr kinyerhet a szsorozat egyszeren az llapotok
szcmkinek kigyjtsvel. gy a Viterbi-algoritmus a szszegmentls problmjt gy oldja meg, hogy
dinamikus programozst felhasznlva (valjban) egyszerre figyelembe veszi az sszes lehetsges szsorozatot
s szhatrt.
Vegyk szre, hogy nem azt mondtuk, hogy kinyerhet a legvalsznbb szsorozat. A legvalsznbb
szsorozat nem szksgkppen az, ami a legvalsznbb llapotsorozatot tartalmazza. Ez amiatt van gy, mert
egy szsorozat valsznsge az sszes olyan llapotszekvencia valsznsgnek sszege, amely konzisztens
ezzel a szsorozattal. Kt szsorozatot sszehasonltva, mondjuk a back s aback szsorozatokat,
elfordulhat, hogy tz alternatv llapotsorozat van az a back-hez, ezek mindegyike 0,03 valsznsggel, de
csak egyetlen llapotsorozat az aback-hez, viszont 0,20 valsznsggel. A Viterbi-algoritmus az aback-t
vlasztja, pedig az a back valjban valsznbb.
A gyakorlatban ez a nehzsg nem letveszlyes, de elg komoly ahhoz, hogy ms mdszereket is
kiprbljanak. A legltalnosabb vlaszts az A* dekdol (A* decoder), ami lelemnyesen hasznlja fel az
A* keresst (lsd 4. fejezet) a legvalsznbb szsorozat megtallsban. Az tlet az, hogy minden szsorozatot
egy olyan grfon tvezet tnak fogunk fel, aminek a csompontjai a szavakkal vannak felcmkzve. Egy
csompont gyermekei az sszes olyan sz, amelyek utna kvetkezhetnek; gy az szszes n hosszsg vagy
rvidebb mondathoz tartoz grfnak n szintje van, mindegyik W szlessg, ahol W a lehetsges szavak szma.
A bigram modellnl a w1 s w2 cmkj csompontok kzti nylhoz rendelt g(w1,w2) kltsget a logP(w2|w1)
definilja. Ekkor egy sorozat teljes tkltsge
kinyerik az akusztikus jelbl. Megtrgyaltuk, hogyan hozhatunk ltre egy nyelvi modellt, s a jelfeldolgozs
rszletei ms knyvekben is megtallhatk. gy mr csak a kiejtsi s a beszdhangmodellek maradnak. A
kiejtsi modellek struktrja mint a paradicsom modelljei a 15.19. brn ltalban kzi fejleszts. Nagy
fonetikai sztrak most mr elrhetk angol s ms nyelvekhez, br a pontossguk nagymrtkben vltozik. A
hromllapot beszdhangmodell struktrja minden beszdhangra ugyanaz, mint a 15.20. brn lthat. gy
mr csak a valsznsgek maradnak. Honnan szerezhetk be ezek, klnsen hogy a modellek paramterek
szzezreit vagy akr milliit is ignyelhetik?
Az egyetlen elfogadhat mdszer a modellek tanulsa valdi beszdadatbl, amibl bizonyosan nincsen hiny.
A kvetkez krds a tanuls mikntje. A teljes vlaszt a 20. fejezetben adjuk meg, de a f elkpzelseket itt is
bemutathatjuk. Gondoljuk t a bigram nyelvi modellt; ennek megtanulst mr elmagyarztuk, ami a szprok
gyakorisgnak a vizsglatn alapult valdi szvegben. Megtehet ugyanez mondjuk a beszdhangok tmenetvalsznsgeire is a kiejtsi modellben? A vlasz igen, de csak akkor, ha valaki veszi a fradsgot, s
vgigjegyzeteli az sszes elfordul szt a helyes beszdhangsorozattal. Ez egy bonyolult s szmos
hibalehetsget magban rejt feladat, de nhny standard adathalmazra elvgeztk, amelyek tbb rs beszdet
tartalmaznak. Ha ismerjk a beszdhang-szekvencit, akkor a kiejtsi modell tmenet-valsznsgeit
megbecslhetjk a beszdhangprokbl. Hasonlan, ha minden keretre ismert a beszdhangllapot egy mg
gytrelmesebb kzi felcmkzs eredmnyekppen akkor megbecslhetjk a beszdhangmodell tmenetvalsznsgeit is. Ha minden keretben ismerjk a beszdhangllapotot s az akusztikus jegyeket, akkor pedig
megbecslhetjk az akusztikai modellt, akr kzvetlenl a gyakorisgokbl (a VK modellek esetben) vagy
statisztikai illesztsi mdszerekkel (a Gauss-modellek keverke esetben; lsd 20. fejezet).
Fontos
A kzi cmkzs adatnak a kltsge s a ritkasga, illetve az a tny, hogy az elrhet kzi cmkzs
adathalmazok nem felttlenl reprezentljk a beszlk s az akusztikus felttelek azon tpusait,
amelyek egy j beszdfelismersi feladatban fellpnek, ezt a megkzeltst buksra tlik. Szerencsre
a vrhatrtk-maximalizls vagy EM algoritmus (expectation-maximization, EM) anlkl is
megtanulja az RMM tmenetvalsznsgeit s rzkel modelljeit, hogy cmkzett adatot hasznlna.
Kzi cmkzs adatokbl szrmaz becslseket felhasznlhatunk a modell kezdeti belltsra; ezutn
az EM kvetkezik, s betantja a modellt az ppen aktulis feladatra. Az tlet egyszer: egy adott
RMM s egy megfigyelssorozat esetn, felhasznlhatjuk a 15.2. s a 15.3. alfejezet simt
algoritmusait az egyes llapot-valsznsgek kiszmtsra minden idpontban, illetve egy egyszer
kiterjesztssel az llapot-llapot prok valsznsgt is az egymst kvet idpontokban. Ezeket a
valsznsgeket felfoghatjuk bizonytalan cmkknek. A bizonytalan cmkkbl megbecslhetnk j
tmenet- s rzkelsi valsznsgeket, majd az EM eljrs megismtldik. A mdszer minden
iterciban bizonytottan nveli a modell adathoz val illeszkedst, s ltalban a kezdetben belltott
kzi cmkzs becslsek rtkeinl, a paramterrtkek egy sokkal jobb halmazhoz konvergl.
A legkorszerbb beszdfelismer rendszerek risi adathalmazokat s hatalmas szmtsi erforrsokat
hasznlnak fel a modelljeik tantshoz. Egyedlll szfelismersnl, j akusztikus felttelekkel (httrzaj s
visszhang nlkl), egy nhny ezres sztrnl s egy beszl esetn, a pontossg 99% feletti lehet. Folytonos
beszdfelismersnl s tbb klnfle beszl esetn, a 6080%-os pontossg az ltalnos, mg j akusztikus
krlmnyek esetn is. Httrzajnl s telefonos tvitelnl a pontossg tovbb romlik. Br az zembe helyezett
rendszerek vtizedek ta javulnak, szmos tlet mg kidolgozsra vr.
7. sszefoglals
Ez a fejezet az brzols s a kvetkeztets ltalnos problmjt trgyalta idbeli valsznsgi folyamatok
esetben. A legfbb pontok a kvetkezk:
A vilg vltoz llapott valsznsgi vltozk halmaznak a felhasznlsval kezeljk, amelyek az
llapotot brzoljk minden idpontban.
Kidolgozhatk olyan reprezentcik, amelyek eleget tesznek a Markov-tulajdonsgnak (Markov property),
nevezetesen, hogy a jv fggetlen a mlttl a jelen ismeretben. Ez egyttesen a folyamat stacionaritsnak
(stationary) feltevsvel azaz azzal, hogy a dinamika az idvel nem vltozik nagyban egyszersti a
reprenzentcit.
507
Created by XMLmind XSL-FO Converter.
Egy idbeli valsznsgi modellt felfoghatunk egy llapottmenet-modell (transition model) s egy
rzkel modell (sensor model) egyttesnek, ahol az els az llapot alakulst, a msodik pedig a
megfigyels folyamatt rja le.
Idbeli modellekben az alapvet kvetkeztetsi feladatok a szrs (filtering), az elrejelzs (prediction), a
simts (smoothing) s a legvalsznbb magyarzat kiszmtsa (most likely explanation). Ezek
mindegyike elvgezhet egyszer, rekurzv algoritmusokkal, melyek futsi ideje a szekvencia hosszban
lineris.
Idbeli modellek hrom csaldjt tanulmnyoztuk rszletesebben: a rejtett Markov-modelleket (hidden
Markov modell), a Kalman-szrket (Kalman filters), s a dinamikus Bayes-hlkat (dynamic Bayesian
networks) (ami magban foglalja a msik kettt, mint specilis esetet).
A beszdfelismers (speech recognition) s a kvets (tracking) az idbeli valsznsgi modellek kt
fontos alkalmazsi terlete.
Hacsak nincsenek specilis felttelezseink, mint a Kalman-szrknl, egzakt kvetkeztets tbb
llapotvltoz esetn nem kivitelezhet. A gyakorlatban a rszecskeszr (particle filtering) algoritmus
tnik egy hatkony kzelt algoritmusnak.
508
Created by XMLmind XSL-FO Converter.
A dinamikus Bayes-hlkra tekinthetnk gy, mint a Markov-folyamatok egy ritka kdolsra, s az MI-n bell
elsknt a kvetkez munkkban hasznltk fel: (Dean s Kanazawa, 1989b; Nicholson, 1992; Kjaerulff, 1992).
A legutbbi munkk egyike a Hugin Bayes-hls rendszer ltalnos kiterjesztse, ami dinamikus Bayes-hlk
generlshoz s szerkesztshez biztostja a szksges eszkzket. A dinamikus Bayes-hlk npszerv
vltak klnbz komplex mozgsi folyamatok modellezsre a szmtgpes lts terletn (Huang s trsai,
1994; Intille s Bobick, 1999). A kapcsolatot az RMM-k s a DBH-k kztt, illetve az elre-htra algoritmus s
a Bayes-hls terjeszts kztt Smyth s trsai tisztztk (Smyth s trsai, 1997). Egy tovbbi egyesgests a
Kalman-szrkkel (s ms statisztikai modellekkel) Roweis s Ghahramani munkjban jelenik meg (Roweis s
Ghahramani, 1999).
A 15.5. fejezetben lert rszecskeszr algoritmusnak klnsen rdekes trtnete van. Az els szrsre
szolgl mintavteli algoritmus a szablyozselmlet terletn szletett (Handschin s Mayne, 1969), s az
jramintavtelezs tlete, ami a rszecske- szrs kzponti eleme egy szablyozstechnikval foglalkoz orosz
folyiratban jelent meg (Zaritskii s trsai, 1975). Ksbb tbbszr jra felfedeztk: a statisztika terletn mint
szekvencilis fontossgi mintavtelezs jramintavtelezs (SUFM) (sequential importance-sampling
resampling, SIR) (Rubin, 1988; Liu s Chen, 1998), a szablyozselmlet terletn mint rszecskeszrs
(Gordon s trsai, 1993; Gordon, 1994), a mestersges intelligencia terletn mint a legjobb tllse (survival
of the fittest) (Kanazawa s trsai, 1995) s a szmtgpes ltsban mint srts (condensation) (Isard s
Blake, 1996). Kanazawa munkja egy javtst is tartalmazott, az gynevezett bizonytkmegfordtst (evidence
reversal), ami ltal a t + 1 idpontban az llapot mintavtelezse a t idpontbeli llapot s a t + 1 idpontbeli
bizonytk felttelek mellett trtnik (Kanazawa s trsai, 1995). Ez lehetv teszi, hogy a bizonytk
kzvetlenl befolysolja a mintk generlst s bizonytottan cskkenti a kzeltsi hibt (Doucet, 1997).
A kzelt szrsre szolgl mdszerek kztt talljuk a lecseng MCMC (decayed MCMC) algoritmust
(Marthi s trsai, 2002) s a faktorizlt kzelts mdszert Boyen s trsaitl (Boyen s trsai, 1999). Mindkt
mdszer rendelkezik azzal a fontos tulajdonsggal, hogy a kzeltsi hiba nem n az idvel. Varicis
technikkat (lsd 14. fejezet) szintn fejlesztettek ki idbeli modellekre. Ghahramani s Jordan egy kzelt
algoritmust ismertet faktorilis RMM-kre, gy olyan DBH-ra, amiben kt vagy tbb fggetlenl fejld Markovlnc egy kzs megfigyelsi folyammal van sszekapcsolva (Ghahramani s Jordan, 1997). Jordan s trsai
szmos ms alkalmazst is trgyalnak (Jordan s trsai, 1998). A keversi idk tulajdonsgait Pak, valamint
Luby s Vigoda trgyalja (Pak, 2001; Luby s Vigoda, 1999).
A beszdfelismers strtnete az 1920-as vekben kezddtt Radio Rexszel, a hangvezrls jtk kutyval.
Rex ugrlt az 500 Hz krli hangfrekvencikra vlaszul, ami az [eh] magnhangzhoz tartozik a Rex!-ben.
Kiss komolyabb munka a msodik vilghbor utn kezddtt. Az AT&T Bell Labsnl egy rendszert ptettek
egyedlll szmjegyek felismersre akusztikus jellemzk egyszer mintaillesztsvel (Davis s trsai, 1952).
A beszdhang tmenet-valsznsgeket elszr egy, a londoni University College-ban ptett rendszerben
hasznltak (Fry, 1959; Denes, 1959). 1971-ben az Egyeslt llamok Vdelmi Minisztriumnak Kutatsi
gynksge (Defense Advanced Research Project Agency, DARPA) ngy tves kutatsi tervet kezdett el
finanszrozni, hogy nagy teljestmny beszdfelismer rendszereket fejlesszenek ki. A gyztes, s egyben az
egyetlen rendszer, ami az 1000 szavas sztron a kitztt 90%-os pontossgot elrte, a HARPY rendszer volt a
CMU-rl (Lowerre, 1976; Lowerre s Reddy, 1980). 9 A HARPY vgs vltozatt egy DRAGON nev rendszerbl
szrmaztattk, amit egy CMU-s dik, James Baker ptett (Baker, 1975). A DRAGON volt az els rendszer, ami
RMM-eket hasznlt beszdre. Majdnem egy idben Jelinek az IBM-nl kifejlesztett egy msik RMM-alap
rendszert (Jelinek, 1976). Ettl az idponttl kezdve, a valsznsgi mdszerek ltalban is, de az RMM-ek
klnsen egyre inkbb dominltk a beszdfelismers kutatst s fejlesztseit. Az utbbi veket a gyarapod
fejlds, a nagyobb adathalmazok s modellek, s a szigorbb verseny realisztikusabb beszdhelyzeteken
jellemzi. Egyes kutatk megvizsgltk a DBH-k felhasznlsnak lehetsgt az RMM-ek helyett, azzal a cllal,
hogy a DBH-k nagyobb kifejezerejt kihasznlva a beszdkpz szervek komplex rejtett llapotbl tbbet
tudjanak megragadni (Zweig s Russell, 1998; Richardson s trsai, 2000).
A beszdfelismershez j bevezet irodalom (Rabiner s Juang, 1993; Jelinek, 1997; Gold s Morgan, 2000;
Huang s trsai, 2001). A tmhoz tartoz fontos cikkek gyjtemnye (nhny ttekint cikket is belertve)
(Waibel s Lee, 1990). Jelen fejezet anyagt Kay, Gawron s Norvig ttekint munkjra (Kay s trsai, 1994),
valamint Jurafsky s Martin egyik knyvre alapoztuk (Jurafsky s Martin, 2000). A beszdfelismersrl
kutatsi eredmnyeket kzlnek a Computer Speech and Language, a Speech Communication s az IEEE
A versenyben msodikknt vgz rendszernek, a HEARSAYII-nek az MI ms gaira volt nagy hatsa, mert a tblaarchitektrt
(blackboard architecture) hasznlta (Erman s trsai, 1980). Ez egy szablyalap szakrti rendszer volt, tbb tbb-kevsb fggetlen
modulris tudsforrssal (knowledge source) rendelkezett, amelyek egy kzs tbla (blackboard) rvn kommunikltak egymssal,
olvashattak a tblrl s rhattak r. A tblaarchitektrt hasznl rendszerek a modern felhasznli felletek architektrinak az alapjai.
9
509
Created by XMLmind XSL-FO Converter.
Transactions on Acoustics, Speech, and Signal Processing folyiratok, valamint a DARPA Workshops on
Speech and Natural Language Processing kiadvnyok, tovbb a Eurospeech, az ICSLP s az ASRU
konferencik kiadvnyai.
7.2. Feladatok
15.1.
Mutassa meg, hogy brmely msodrend Markov-folyamatot t lehet rni elsrend Markov-folyamatt az
llapotvltozknak egy megnvelt halmazt hasznlva. Megtehet-e ez mindig takarkosan, azaz az
llapottmenet-modellt megad paramterek szmnak a nvelse nlkl?
15.2.
Ebben a feladatban azt vizsgljuk, hogy mi trtnik a valsznsgekkel az esernys vilgban, ha az idsorok
hossza a vgtelenbe tart.
a. Ttelezzk fel, hogy a napok olyan vgtelen sort figyeljk meg, amikor az eserny mindig feltnik. Mutassa
meg, hogy a napok mlsval az es valsznsge az aktulis napon monoton nvekszik egy hatrrtkhez.
Szmtsa ki ezt a hatrrtket.
b. Most gondolja t az elrejelzs-t az egyre tvolabbi jvben, csupn a kt els eserny megfigyels
ismeretben. Elszr szmolja ki a P(R2+k |U1, U2) valsznsget k = 120 esetn, s brzolja az
eredmnyeket. A valsznsgnek lthatan konverglnia kell egy hatrrtkhez. Szmtsa ki a hatrrtk
pontos rtkt.
15.3.
Ez a feladat a 15.4. brn lert elre-htra algoritmus egy trtakarkos vltozatt fejleszti ki. A P(Xk|e1:t)
valsznsget szeretnnk kiszmtani k = 1, , t-re. Ezt egy oszd meg s uralkodj sma szerint vgezzk el.
a. Ttelezzk fel az egyszersg kedvrt, hogy t pratlan, s legyen a felezpont h = (t + 1) /2. Mutassa meg,
hogy P(Xk|e1:t) kiszmthat k = 1, , h esetn csupn az f1:0 kezd elrefel zenetet, a bh+1:t visszafel
zenetet s az e1:h bizonytkokat ismerve.
b. Mutassa meg, hogy a sorozat msodik felre is fennll egy hasonl eredmny.
c. Az (a) s (b) eredmnyek ismeretben egy rekurzv oszd meg s uralkodj algoritmust lehet ltrehozni,
elszr elrefel haladva a sorozaton s aztn visszafel a vgtl, csak a szksges zeneteket trolva
kzpen s a vgeken. Aztn az algoritmus lefut mindkt flre. rja le az algoritmust rszletesen.
d. Szmtsa ki az algoritmus tr- s idkomplexitst a sorozat hossznak, t-nek a fggvnyben. Hogyan
vltozik ez, ha felosztjuk a bemenetet kt rszre?
15.4.
A 2.3. szakasz - A legvalsznbb sorozat megtallsa rszben vzoltunk egy hibs eljrst a legvalsznbb
llapotszekvencia megtallsra egy adott megfigyelsi szekvencia esetn. Az eljrs azon alapul, hogy
megkeresi a legvalsznbb llapotokat minden egyes idpontra, s visszaad egy ezen llapotokbl ll
sorozatot. Mutassa meg, hogy bizonyos idbeli valsznsgi modellekre s megfigyelsi sorozatokra, ez az
eljrs egy lehetetlen llapotsorozatot ad vissza (azaz amely sorozatnak az a posteriori valsznsge nulla).
15.5.
Gyakran szeretnnk megfigyelni egy olyan folytonos llapot rendszert, aminek a viselkedse
megjsolhatatlanul vlt k klnbz md kztt. Pldul egy replgp egy rakta elkerlse kzben
klnbz manvereket hajthat vgre, melyeket a rakta megprblhat kvetni. Egy ilyen vlt Kalman-szr
Bayes-hl reprezentcija a 15.22. brn lthat.
a. Ttelezzk fel, hogy az St diszkrt llapotnak k lehetsges rtke van, illetve, hogy a P(X0) a priori folytonos
llapotbecsls egy tbbvltozs Gauss-eloszls. Mutassa meg, hogy a P(X1) elrejelzs Gauss-eloszlsok
510
Created by XMLmind XSL-FO Converter.
keverke (mixture of Gaussians) azaz Gauss-eloszlsok slyozott sszege, ahol a slyok 1-re
sszegzdnek.
b. Mutassa meg, hogy ha a jelenlegi folytonos llapot becslse, P(Xt|e1:t), m Gauss-eloszls keverke, akkor
ltalnos esetben a P(Xt+1|e1:t+1) frisstett llapotbecsls km Gauss-eloszls keverke lesz.
c. Az idbeli folyamatnak milyen jellegt reprezentljk a slyok a Gauss-keverkben?
Az (a) s (b) eredmnyek egytt azt mutatjk, hogy az a posteriori eloszls reprezentcija korltozs nlkl n,
mg a vlt Kalman-szrk esetben is, amelyek a legegyszerbb hibrid dinamikus modellek.
15.6.
Ptolja a hinyz lpst a (15.17) egyenlet levezetsben, az els frisstsi lpst az egydimenzis Kalmanszrnl.
15.7.
Vizsgljuk meg a szrsngyzet-frissts alakulst a (15.18) egyenletben.
a. brzolja a t2 rtkt a t fggvnyben, adott x2 s z2 rtkek mellett.
b. Mutassa meg, hogy a frisstsnek ltezik egy 2 hatrrtke gy, hogy t esetn t2 2, s szmtsa ki
ezt a 2 rtket.
c. Adjon kvalitatv magyarzatot arra, hogy mi trtnik, ha x2 0 s z2 0.
15.8.
Mutassa meg, hogyan reprezentlna egy RMM-et egy rekurzv relcis valsznsgi modellknt, amint azt a
14.6. fejezetben javasoltuk.
511
Created by XMLmind XSL-FO Converter.
15.9.
Ebben a feladatban rszletesebben elemezzk az akkumultorrzkel tartshiba-modellt (lsd 15.13. (a) bra).
a. A 15.13. (b) bra vget r t = 32-nl. rja le kvalitatvan, mi trtnik t esetn, ha az rzkel tovbbra is
0-t mutat.
b. Tegyk fel, hogy a kls hmrsklet befolysolja az akkumultor rzkeljt, mghozz olyan mdon, hogy
a hmrsklet emelkedsvel az tmeneti hibk valsznbbekk vlnak. Mutassa meg, hogyan egszten ki
a 15.13. (a) bra DBH-struktrjt, s magyarzza el az esetlegesen szksges vltoztatsokat az FVT-kben.
c. Az j hlstruktra esetn felhasznlhatja-e a robot az akkumultormrseket az aktulis hmrsklet
kikvetkeztetsre?
15.10.
Gondoljuk meg a vltoz eliminls algoritmusnak az alkalmazst az esernys DBH hrom szeletre trtn
kibontsa esetn a P(R3|U1, U2, U3) krds megvlaszolsra. Mutassa meg, hogy az algoritmus komplexitsa a
legnagyobb tnyez mrete ugyanaz, fggetlenl attl, hogy az es vltozkat elrefel vagy visszafel
sorrendben eliminljuk.
15.11.
A 15.19. bra tomato modellje megengedi a koartikulcit az els magnhangzn kt lehetsges beszdhangot
knlva fel. Egy alternatv megkzelts a hromllapot modell hasznlata, amelyben az [ow(t,m)] beszdhang
automatikusan magban foglalja a magnhangz vltozst. Rajzoljon egy teljes hromllapot modellt a
tomato-ra, idertve a tjszlsos vltozatokat.
15.12.
Szmolja ki a legvalsznbb utat a 15.20. bra RMM-n keresztl a [C1, C2, C3, C4, C5, C6, C7] kibocstsi
sorozat esetn. Adja meg ennek valsznsgt is.
512
Created by XMLmind XSL-FO Converter.
A maximlis vrhat hasznossg (MVH) (maximum expected utility, MEU) elve azt mondja ki, hogy egy
racionlis gensnek azt a cselekvst kell vlasztania, ami maximalizlja az gens vrhat hasznossgt. Ha
cselekvsek egy legjobb sorozatt szeretnnk kivlasztani ennek az egyenletnek a felhasznlsval, akkor az
513
Created by XMLmind XSL-FO Converter.
sszes lehetsges cselekvssorozatot szmba kellene venni, s a legjobbat kivlasztani, ami hossz sorozatok
esetn nyilvnvalan nem lehetsges. Ezrt ez a fejezet egyszer dntsekre (ltalban egyetlen cselekvsre
vonatkoz dntsekre) koncentrl, s a kvetkez fejezet mutat be j technikkat cselekvssorozatok hatkony
kezelsre.
Bizonyos rtelemben az MVH-elv felfoghat a teljes MI meghatrozsnak. Hiszen egy intelligens gensnek
mindssze annyit kell tennie, hogy kiszmtja a klnfle mennyisgeket, maximalizlja a hasznossgot a
cselekvsei felett, s ksz. m ez nem jelenti, hogy ezzel a defincival az MI problmakre meg lenne oldva!
mbr az MVH-elv brmely dntsi helyzet esetn meghatrozza a helyes cselekvst, a szksges szmtsok
lehetnek kivitelezhetetlenek, s nha maga a problma megfogalmazsa is bonyolult. A vilg kezdeti
llapotnak ismerete rzkelst, tanulst, tudsreprezentcit s kvetkeztetst ignyel. A
P(Eredmnyi(A)|Tesz(A), E) kiszmtsa a vilg teljes okozati modelljt ignyli, s ahogyan azt a 14.
fejezetben lttuk NP-teljes szmtst a valsznsgi hlzatokban. Az egyes llapotok U(Eredmnyi(A))
hasznossgnak a kiszmtsa gyakran keresst vagy tervezst ignyel, mivel az gens nem tudja, hogy egy
llapot mennyire j addig, ameddig nem tudja, hogy hova is kerlhet ebbl az llapotbl. gy a dntselmlet
nem csodaszer, ami megoldja az MI-problmt. Msrszrl azonban, ez egy olyan keretet ad, amelyben
ttekinthet egy MI-rendszer sszes rsznek a beilleszkedse.
Fontos
Az MVH-elv egyrtelmen kapcsoldik a 2. fejezetben felvetett teljestmnymrtkek elkpzelshez.
Az alaptlet nagyon egyszer. Tekintsk azokat a lehetsges krnyezeteket, amelyek rzkelssel s
memrival rendelkez genseket tesznek lehetv, s gondoljuk t azt, hogy milyen lehetsges
genseket tudnnk tervezni. Ha egy gens maximalizlja a hasznossgfggvnyt, s az helyesen
tkrzi a teljestmny mrtkt, amivel a viselkedst megtlik, akkor ez a lehet legmagasabb
teljestmnypontszmot ri el, ha a hasznossgot azon lehetsges krnyezetek felett tlagoljuk,
amelyekbe az gens kerlhet. Ez az alapvet igazolsa az MVH-elvnek. Br az llts tautolginak
tnhet, valjban nagyon fontos tmenetet jelent a racionalits globlis, kls kritriumaitl a
mltbeli krnyezetek felett vett teljestmnytl egy loklis, bels kritriumig, ami a kvetkez
llapotra vonatkoz hasznossgfggvny maximalizlst jelenti.
Ebben a fejezetben csak az egyszeri vagy egylpses dntsekkel (one-shot decisions) foglalkozunk, br a 2.
fejezet a teljestmnymrtkeket a mltbeli krnyezetek felett definilja, amelyek ltalban szmos dntst
tartalmaznak. A kvetkez fejezetben, ami a szekvencilis dntsekkel (sequential decisions) foglalkozik,
megmutatjuk, hogy ez a kt nzet hogyan bkthet ssze.
2. A hasznossgelmlet alapjai
Rnzsre az MVH-elv sszer mdszernek ltszik dntsek meghozatalra, de az nem vilgos, hogy vajon ez-e
az egyetlen lehetsg. Vgl is, a hasznossg tlagnak maximlsa mirt is lenne olyan klnleges? Mirt nem
maximalizljuk a lehetsges hasznossgok kbeinek sszegt, vagy mirt nem minimalizljuk a lehetsges
vesztesgek maximumt? Hasonlan, mirt nem cselekedhet az gens racionlisan, ha csupn az llapotok
kztti preferenciit rgzten, s nem rendelne hozzjuk numerikus rtket? Vgl, egyltaln mirt kell
lteznie egy megkvetelt tulajdonsgokkal rendelkez hasznossgfggvnynek? Taln egy racionlis gensnek
olyan bonyolult a preferenciarendszere, hogy azt nem lehet ilyen egyszeren az egyes llapotokhoz rendelt vals
szmokkal kifejezni.
514
Created by XMLmind XSL-FO Converter.
Termszetesen tisztzni kell, hogy mit is jellhet A s B. Ha az gens cselekvsei determinisztikusak, akkor A s
B tipikusan a cselekvsek konkrt, teljesen specifiklt eredmnyllapotai. Az ltalnosabb, nemdeterminisztikus
esetben A s B szerencsejtkok (lotteries). Egy szerencsejtk alapveten egy valsznsgi eloszls az
aktulis kvetkezmnyek halmaza felett (melyek a szerencsejtk djai). Az L szerencsejtkot a C1, , Cn
kvetkezmnyekkel, amelyek p1, , pn valsznsgekkel kvetkezhetnek be, a kvetkezkppen jelljk:
L = [p1, C1; p2, C2; pn, Cn]
16.1. bra - (a) A cserk egy teljes ciklusa, bemutatva, hogy a nemtranzitv A B C
A preferencik irracionlis viselkedst eredmnyeznek. (b) A felbonthatsgi axima.
(Az egyetlen kvetkezmnnyel rendelkez szerencsejtk A-val vagy [1, A]-val jellhet.) ltalban egy
szerencsejtk brmely kvetkezmnye lehet egy atomi llapot vagy egy msik szerencsejtk. Az elsdleges
krds a hasznossgelmlet szmra annak megrtse, ahogyan az sszetett szerencsejtkok kztti
preferencik viszonyulnak ezen szerencsejtkokat meghatroz llapotok kztti preferencikhoz.
Ennek elrshez sszer megktseket runk el a preferenciarelcikra, hasonlan ahhoz, ahogyan racionlis
knyszereket vrtunk el a meggyzds mrtkeivel kapcsolatban a valsznsg aximinak a szrmaztatsnl
a 13. fejezetben. Egy sszer megkts, hogy a preferencik tranzitvak (transitive) legyenek: azaz ha A B
s B C, akkor elvrhatjuk, hogy A C. A tranzitivits indoklsaknt megmutatjuk, hogy egy gens, amelynek
a preferencii nem tranzitvak, irracionlisan viselkedne. Ttelezzk pldul fel, hogy egy gens preferencii
nem tranzitvak: A B C A, ahol A, B s C ruk, amik szabadon cserlhetk. Ha az gensnl jelenleg A
van, akkor felknlhatjuk C-t cserbe A-rt s egy kis pnzrt. Ha az gens jobban szereti C-t, akkor hajland
lesz pnzt is ldozni C megszerzsre. Ezutn felknlhatjuk B-t C-rt, mg tbb pnzt begyjtve, s vgl
elcserljk B-t A-rt. Ezzel visszartnk a kezdeti llapotba, azt leszmtva, hogy az gensnek kevesebb a pnze
(16.1. (a) bra). Ezt a ciklust addig folytathatjuk, ameddig az gens sszes pnze el nem fogy. Indokoltnak
ltszik azt lltani, hogy az gens ebben a helyzetben nem cselekedett racionlisan.
A kvetkez hat megktst a hasznossgelmlet aximinak szoks tekinteni. Ezek a preferencikra s a
szerencsejtkokra vonatkoz legnyilvnvalbb szemantikai megktseket hatrozzk meg.
Sorrendezhetsg (orderability). Brmely kt llapot esetn az gensnek vagy preferlnia kell az egyiket a
msikkal szemben, vagy egyformn preferltnak kell minstenie mindkettt. Azaz az gens nem kerlheti el
a dntst. Ahogyan az 3.1. szakasz - A valsznsgi aximk hasznlata rszben trgyaltuk, egy fogads
visszautastsa az id folysnak a felfggesztshez hasonl.
515
Created by XMLmind XSL-FO Converter.
Tranzitivits (transitivity). Brmely hrom llapot esetn, ha az gens preferlja A-t B-vel szemben, s B-t
C-vel szemben, akkor az gensnek preferlnia kell A-t is C-vel szemben.
(A B) (B C) (A C)
Felbonthatsg (Decomposability): sszetett szerencsejtkok egyszerbbekre bonthatk a valsznsgszmts szablyai szerint. Ezt a hazrdjtk unalmas szablynak neveztk el, mivel ez azt mondja ki, hogy
kt egymst kvet szerencsejtkot ssze lehet olvasztani egyetlen ekvivalens szerencsejtkba, ahogyan azt
a 16.1. bra mutatja.1
[p, A; 1 p, [q, B; 1 q, C]] [p, A; (1 p)q, B; (1 p)(1 q), C]
516
Created by XMLmind XSL-FO Converter.
Fontos megjegyezni, hogy a hasznossgfggvny lte, ami lerja az gens preferenciit, nem jelenti azt
szksgszeren, hogy az gens explicit mdon maximalizl egy hasznossgfggvnyt a mrlegelsei sorn.
Amint azt a 2. fejezetben megmutattuk, racionlis viselkeds szmos mdon elllthat, nmelyik sokkal
hatkonyabb, mint a hasznossg maximalizlsnak explicit elvgzse. Az gens preferenciinak
megfigyelsvel azonban lehetsgess vlik a hasznossgfggvny megkonstrulsa, ami az gens elrni
szndkozott cljait reprezentlja.
3. Hasznossgfggvnyek
A hasznossg egy fggvny, ami vals szmokat rendel az llapotokhoz. Vajon ez minden, amit a
hasznossgfggvnyrl el lehet mondani? Szigoran nzve, igen, ennyi. A korbban felsorolt megktseknek
eleget tve az gensnek tetszleges preferencii lehetnek. Pldul az gens preferlhatja, hogy a bankbettjein
elhelyezett dollrok szma prmszm legyen; ekkor, ha 16 dollrja volna, 3-at elajndkozna. Lehet, hogy egy
1973-as ttt-kopott Ford Pintt jobban szeret, mint egy csillog j Mercedest. A preferencik kapcsolatban
llhatnak egymssal; pldul lehet, hogy csak akkor preferl prmszm dollrt, ha Pintja van, de amikor
Mercedese van, akkor a tbb dollrt jobban szereti, mint a kevesebbet.
Ha az sszes hasznossgfggvny ilyen tetszleges volna, mint ez, akkor viszont a hasznossgelmletnek nem
lenne sok haszna, mivel meg kellene figyelnnk az gens preferenciit minden lehetsges krlmny esetn,
mieltt a viselkedsvel kapcsolatban brmilyen elrejelzsre is kpesek lennnk. Szerencsre az igazi gensek
preferencii sokkal rendszerezettebbek. Ennek megfelelen szisztematikus mdszerek lteznek a
hasznossgfggvnyek megtervezsre, amelyeket aztn egy mestersges gensbe beptve az gens a helyes,
ltalunk elvrt viselkedst fogja produklni.
Annak eldntshez, hogy mit is tegynk, az egyes kimeneteli llapotokhoz hasznossgot kell rendelnnk. A
hasznossg nem kzvetlenl arnyos a pnzgyi rtkkel, mivel a hasznossg az okozott pozitv vltozs az
letstlusban az els milli dollr esetn nagyon nagy (vagy legalbbis azt mondjk), ezzel szemben a tovbbi
517
Created by XMLmind XSL-FO Converter.
millik hasznossga sokkal kisebb. Ttelezzk fel, hogy 5-s hasznossgot rendel a jelenlegi (Sk) pnzgyi
helyzethez, 10-et az Sk+3 000 000 llapothoz, 8-at az Sk+1 500 000 llapothoz. Ekkor a racionlis dnts az elutasts lenne,
mivel az elfogads vrhat hasznossga 7,5 (kisebb, mint az elutastshoz tartoz 8). Most ttelezze fel, hogy
mr van a szmljn 500 000 000 dollr (s a jtkban val rszvtel csak a mka kedvrt trtnik). Ebben az
esetben a hazrdjtk valsznleg elfogadhat, feltve, hogy a tbb pnzt preferlja a kevesebbel szemben,
mivel az 503-adik milli haszna valsznleg ugyanakkora, mint az 501-edik milli.
A valsgos hasznossgi fggvnyekrl szl ttr jelentsg tanulmnyban Grayson azt tallta, hogy a pnz
hasznossga majdnem teljesen arnyos a mennyisgnek logaritmusval (Grayson, 1960). (Ezt elszr
Bernoulli vetette fel [Bernoulli, 1783]; lsd 16.3. feladat.) Egy ilyen grbe, egy bizonyos Beard r, a 16.2. (a)
brn lthat. A Beard rtl kapott preferencik konzisztensek a kvetkez hasznossgi fggvnnyel:
U(Sk+n) = 263,31 + 22,09 log(n + 150 000)
16.2. bra - A pnz hasznossga. (a) Empirikus adat Beard rtl egy korltos
tartomnyban. (b) Egy tipikus grbe a teljes tartomnyban.
Ha csak a grbe pozitv rszt vizsgljuk, ahol a meredeksg cskken, akkor itt brmely L szerencsejtk esetn
a vrhat hasznossg kisebb, mint annak a biztos esemnynek a hasznossga, amikor az tadott pnzgyi rtk a
vrhat pnzgyi rtkkel egyezik meg.
U(L) < U(SVP(L))
Azaz az ilyen alak grbvel rendelkez gens kockzatkerl (risk-averse): elnyben rszest egy biztos
esemnyt egy szerencsejtkkal szemben, mg akkor is, ha a biztos sszeg kisebb, mint a szerencsejtk vrhat
pnzgyi rtke. Msfell, a 16.2. (b) brn a nagy adsgokhoz tartoz elkeseredett rgiban a viselkeds
kockzatkeres (risk-seeking). Azt az rtket, amit az gens a szerencsejtk helyett elfogad, a jtk
determinisztikus ekvivalensnek (certainty equivalent) nevezzk. A tanulmnyok azt mutatjk, hogy a
legtbb ember elfogad krlbell 400 dollrt egy olyan szerencsejtkrt cserbe, ami
valsznsggel
eredmnyez 1000 dollrt s 0 dollrt azaz ennek a szerencsejtknak a determinisztikus ekvivalense 400
dollr. A szerencsejtk vrhat pnzgyi rtke s a determinisztikus ekvivalense kztti rtket biztostsi
prmiumnak (insurance premium) hvjuk. A kockzatkerls az alapja a biztostsi zletgnak, mivel ez azt
jelenti, hogy a biztostsi prmium pozitv. Az emberek inkbb fizetnek egy alacsonyabb biztostsi djat,
2
Az ilyen viselkedst elkeseredettnek nevezhetjk, mindazonltal teljesen racionlis, ha valaki kiltstalan helyzetben van.
518
Created by XMLmind XSL-FO Converter.
mintsem hogy kockra tegyk a hzuk teljes rt egy lehetsges tzeset miatt. Viszont a biztostsi trsasgok
szemszgbl a hz teljes ra igen kicsi a cg sszes vagyonhoz kpest. Emiatt a biztost hasznossgi grbje
megkzelten lineris ebben a kicsiny rgiban, s a biztosts a trsasgnak alig kerl valamibe.
Vegyk szre, hogy a kis vagyoni vltozsok az aktulis vagyoni helyzethez kpest kzel linerisak a grbe
brmely szakaszn. A lineris grbvel rendelkez genst kockzatsemlegesnek (risk-neutral) nevezzk. Ezrt
kis sszeg hazrdjtkok esetn kockzatsemlegessget vrhatunk el. Egy bizonyos rtelemben ez igazolja azt
az egyszerstett eljrst, ami kis sszeg szerencsejtkokkal segtette valsznsgek megbecslst, s
igazolta a valsznsg-szmts aximit a 13. fejezetben.
ahol k1 egy lland s k2 egy tetszleges pozitv lland. Nyilvnval, hogy ez a lineris transzformci nem
befolysolja az gens viselkedst.
Determinisztikus krnyezetekben, ahol llapotok vannak, s nincsenek szerencsejtkok, a viselkeds nem fog
megvltozni semmilyen monoton transzformcira. Pldul vehetjk a kbt az sszes hasznossgnak anlkl,
hogy ez a cselekmnyek preferenciarendezst befolysoln. Egy determinisztikus krnyezetben lv gens
esetn azt mondjuk, hogy az gensnek rtkfggvnye (value function) vagy sorrendezett
hasznossgfggvnye (ordinal utility function) van; a fggvny valjban csak az llapotok sorrendezst
biztostja, s nem ad rtelmezhet numerikus rtkeket. Ezt a klnbsgttelt lttuk a 6. fejezetben a jtkok
esetn: determinisztikus jtkokban, mint a sakk, a kirtkel fggvnyek rtkfggvnyek, mg
nemdeterminisztikus jtkokban, mint az ostbla, ezek valdi hasznossgfggvnyek.
Fontos
Emberi tlethozatal s a hibzs lehetsge
A dntselmlet egy normatv elmlet (normative theory): azt rja el, hogy az gensnek hogyan kell
cselekednie. A kzgazdasgtan elmletnek alkalmazst nagyban javtan, ha ez egyben egy ler
(descriptive) elmlet is volna az aktulis emberi dntshozatalrl. Azonban ksrleti bizonytkok
vannak arra, hogy az emberek szisztematikusan megsrtik a hasznossgelmlet aximit. Egy pldt a
pszicholgus Tversky s Kahneman adnak a kzgazdsz Allais pldja alapjn (Tversky s Kahneman,
1982; Allais, 1953). A ksrleti szemlyeknek ktszer kell vlasztaniuk, az A s a B szerencsejtk,
majd a C s a D szerencsejtk kztt.
A: 4000 dollr 80% esllyel C: 4000 dollr 20% esllyel
B: 3000 dollr 100% esllyel D: 3000 dollr 25% esllyel
A tbbsg B-t vlasztja A-val szemben, s C-t D-vel szemben. De ha elfogadjuk, hogy U(0 dollr) = 0,
akkor az els vlaszts arra utal, hogy 0,8U(4000 dollr) < U(3000 dollr), mg a msodik vlaszts
pontosan a fordtottjra. Mskppen fogalmazva, nincs olyan hasznossgfggvny, ami ezekkel a
vlasztsokkal konzisztens lenne. Az egyik lehetsges kvetkeztets, hogy az emberek egyszeren
irracionlisak a hasznossgelmlet aximi alapjn. Egy alternatv nzet, hogy az elemzs nem veszi
figyelembe a megbnst (regret) azt az rzst, amirl az emberek tudjk, hogy rezni fognak, ha egy
biztos nyeremny (B) helyett egy 80%-os valsznsg nagyobb nyeremnyt vlasztanak, majd
vesztenek. Ms szavakkal, ha A-t vlasztja, 20% eslye van, hogy nem lesz pnze, s gy rzi magt,
mint egy komplett idita.
Kahneman s Tversky tovbbment, s kifejlesztett egy ler elmletet, ami megmagyarzza, hogy az
emberek mirt kerlik a kockzatot nagy valsznsg esemnyeknl, viszont mirt hajlandk
nagyobb kockzatot vllalni valszntlen jutalmakkal. A kapcsolat az MI s ezen tapasztalat kztt az,
hogy az gensnk dntsei csak annyira jk, amennyire jk a preferencik, amin alapulnak. Ha az
emberi informtoraink ellentmondsos preferencikhoz ragaszkodnak, akkor az gensnk semmit sem
tud tenni, hogy konzisztens legyen velk.
519
Created by XMLmind XSL-FO Converter.
Fontos
Orvosi, szlltsi s krnyezetvdelmi problmknl, egyebek kztt, emberek lete forog kockn.
Ezekben az esetekben u a kzvetlen hallesethez (esetleg hallesetekhez) hozzrendelt rtk. mbr
senkinek sem knny rtkeket rendelni emberi letekhez, az tny, hogy sznet nlkl
kompromisszumokat ktnk. A replgpeket csak adott idkznknt vetik al ellenrzseknek, amit
az utazsok s megtett kilomterek hatroznak meg, nem pedig minden utazs utn. A
kltsgcskkentsek miatt a gpkocsik karoszszrija viszonylag vkony fmbl kszl, a balesetek
tllsi arnynak cskkense ellenre. Az lmozott zemanyag mg mindig igen elterjedt, mbr jl
ismert, hogy az egszsgre kros. gy paradox mdon az az ellenkezs, hogy az let pnzben nem
kifejezhet, azt eredmnyezi, hogy az let alulrtkelt. Ross Shachter egy kormnyhivatallal
kapcsolatos lmnyrl szmol be, amely hivatal megrendelt egy tanulmnyt az azbeszt iskolkbl
trtn eltvoltsrl. A tanulmny egy adott pnzsszeget rendelt az iskolskor gyerekek lethez,
s gy rvelt, hogy ezen feltevs mellett a racionlis dnts az azbeszt eltvoltsa. A kormnyhivatal,
morlisan felhborodva teljes mrtkben elutastotta a jelentst. Ezzel egyben az azbeszt eltvoltsa
ellen is dntttek.
Trtntek prblkozsok arra nzve, hogy kidertsk, mennyi rtket tulajdontanak az emberek az letknek.
Az orvosi s biztonsgi elemzsekben kt elterjedt pnznemet hasznlnak, a mikrohallt (micromort) (az
egymilliomod eslyt az elhallozsnak) s a QALY-t, vagy szabvnyos minsg letvet (ami ekvivalens egy
vvel, j vagyoni helyzetben, betegsgektl mentesen). Szmos, szemlyek igen szles krt vizsgl
tanulmny azt mutatta, hogy a mikrohall 20 dollrt r (1980-ban). Azt mr lttuk, hogy a hasznossgfggvny
nemlineris, ezrt ez nem jelenti azt, hogy a dntshoz megln magt 20 milli dollrrt. jra
hangslyozand, hogy a hasznossggrbe loklis linearitsa azt jelenti, hogy a mikrohall s a QALY rtkei kis
relatv kockzatok s jutalmak esetn hasznosak.
4. Tbbvltozs hasznossgfggvnyek
A kzrdek gyeknl trtn dntshozatal mind dollrmillikhoz, mind emberek lethez s hallhoz is
kapcsoldik. Pldul annak eldntsekor, hogy rkkelt anyagok milyen koncentrcii engedhetk meg a
krnyezetben, a dntshozknak mrlegelnik kell a hall megelzst s azokat a kzgazdasgi nehzsgeket,
amelyek bizonyos termkek s folyamatok megszntetse miatt jelentkezhetnek. Egy j repltr elhelyezse
esetn meg kell fontolni az ptkezs okozta felfordulst; a telkek rtkt; a npesebb kzpontoktl val
tvolsgot; a reptr zajt; a biztonsgi krdseket a helyi fldrajzi s az idjrsi viszonyok tekintetben s gy
tovbb. Az ehhez hasonl problmkat, ahol a kimenetelt kt vagy tbb attribtum jellemez a tbbattribtum
hasznossgelmlet (multiattribute utility theory) kezeli.
Jellje X = X1, X2, , Xn az attribtumokat, az attribtumrtkek vektort pedig x = x1, x2, , xn . ltalban
minden attribtumrl felttelezzk, hogy diszkrt vagy folytonos rtkekkel rendelkezik. Az egyszersg
kedvrt felttelezzk, hogy az attribtumokat gy hatroztuk meg, hogy a nagyobb attribtumrtkek nagyobb
520
Created by XMLmind XSL-FO Converter.
hasznossgrtkkhez tartoznak, ha minden ms vltozatlan. Pldul a repltr problma esetn minl nagyobb
a ZajMentessg rtke, annl jobb a megolds. Bizonyos esetekben szksges lehet az rtktartomny
felosztsa, ahol a hasznossgrtkek az egyes tartomnyokban monoton mdon vltoznak.
Elsknt azokat az eseteket vizsgljuk meg, amikor dntseket anlkl hozhatunk, hogy az attribtumrtkeket
egyetlen hasznossgrtkk egyestennk. Majd azokat az eseteket vizsgljuk, ahol az egyes
attribtumkombincik hasznossgt nagyon tmren lehet megadni.
4.1. Dominancia
Ttelezzk fel, hogy az S1 reptr kevesebbe kerl, kisebb zajjal jr s biztonsgosabb is, mint S2. Ekkor az
mondjuk, hogy S1 szigoran dominlja (strict dominance) S2-t. ltalban, ha egy lehetsg minden
attribtumnak kisebb az rtke, mint egy msik lehetsg, akkor nem szksges tovbb vizsgldni. A szigor
dominancia gyakran nagyon hasznos, mert leszkti a vlasztsi lehetsgeket a valdi jelltekre, br ritkn
eredmnyez egyetlen vlasztsi lehetsget. A 16.3. (a) bra egy sematikus helyzetet mutat egy ktattribtumos
esetben.
Furcsnak tnhet, hogy az S1 kltsgrl lv tbb informci az gens dntskpessgt cskkenti. A paradoxonra magyarzatot kapunk,
ha figyelembe vesszk, hogy az egzakt kltsginformci hinyban meghozott dnts kisebb valsznsggel a legnagyobb hasznossg.
3
521
Created by XMLmind XSL-FO Converter.
Fontos
A definci fontossgt az optimlis dnts megvlasztsban a kvetkez tulajdonsg adja: ha A1
sztochasztikusan dominlja A2-t, akkor brmely U(x) monoton nem cskken hasznossgfggvny
esetn, A1 vrhat hasznossga legalbb olyan nagy, mint A2 vrhat hasznossga. Azaz, ha egy
cselekvst egy msik cselekvs minden attribtum esetn sztochasztikusan dominl, akkor az els
cselekvs figyelmen kvl hagyhat.
gy tnhet, hogy a sztochasztikus dominancia meglehetsen matematikai megkzeltst ignyel, meghatrozsa
pedig nagy mennyisg, valsznsggel kapcsolatos szmtst. Valjban azonban szmos esetben igen
knnyen eldnthet. Ttelezzk fel pldul, hogy az ptsi kltsg a npesebb kzpontoktl val tvolsgtl
fgg. A kltsg maga bizonytalan, de a nagyobb tvolsg nagyobb kltsget jelent. Ha S1 kzelebbi, mint S2,
akkor S1 dominlni fogja S2-t a kltsg tekintetben. Br ismertetsktl eltekintnk, de lteznek algoritmusok,
amelyek kpesek kezelni az ilyen kvalitatv informcikat is a bizonytalan vltozk kztti kapcsolatokrl a
kvalitatv valsznsgi hlk (qualitative probabilistic networks) felhasznlsval, lehetv tve, hogy egy
rendszer a sztochasztikus dominancia alapjn hozzon racionlis dntseket anlkl, hogy brmilyen numerikus
rtket hasznlna.
522
Created by XMLmind XSL-FO Converter.
ahol f remlhetleg olyan egyszer fggvny, mint az sszeads. Lthat, hogy ez ahhoz hasonl, ahogy a
valsznsgi hlkat hasznltuk az egyttes valsznsgeloszls-fggvny felbontsra.
Preferencik bizonytalansg nlkl
Kezdjk a determinisztikus esettel. Emlkezznk vissza, hogy determinisztikus krnyezetben az gensnek egy
rtkfggvnye van, : a cl ennek a tmr reprezentlsa. A determinisztikus preferenciastruktrban
megtallhat alapvet szablyszersget preferenciafggetlensgnek (preference independence) nevezzk.
Kt attribtum, X1 s X2 preferencilisan fggetlen X3-tl, ha a preferencia x1, x2, x3 s
fgg X3 konkrt rtktl.
kztt nem
Visszatrve a replteres problmra, ha egyebek mellett a Zaj, a Kltsg s a Hallesetek figyelembe veend
attribtumok voltak, felvethet, hogy a Zaj s a Kltsg preferencilisan fggetlen a Hallesetek-tl. Ekkor
pldul, ha elnyben rszestjk azt az llapotot, ahol 20 000 ember lakik a replsi tvonal kzelben, s az
ptsi kltsg 4 millird dollr, azzal az llapottal szemben, ahol 70 000 ember lakik a replsi tvonalon, s az
ptsi kltsg 3,7 millird dollr, ha a biztonsgi szint mindkt esetben 0,06 halleset milli utas
kilomterenknt, akkor a preferencink a biztonsgi szint 0,13 vagy 0,01 rtke esetben is ugyanaz lenne; s
ugyanaz a fggetlensg llna fenn brmely ms Zaj, Kltsg rtkprra. Az is nyilvnval, hogy a Kltsg s a
Hallesetek preferencilisan fggetlenek a Zaj-tl, s a Zaj s a Hallesetek preferencilisan fggetlenek a
Kltsg-tl. Ekkor azt mondjuk, hogy a {Zaj, Kltsg, Hallesetek} klcsnsen preferencilisan fggetlenek
(KPF) (mutual preferential independence, MPI). A KPF azt lltja, hogy br lehet, hogy mindegyik
attribtum fontos, ez nem befolysolja a tbbi attribtum kztti kompromisszumktst.
A klcsns preferencilis fggetlensg olyasvalami, mint egy hosszra sikeredett szkapcsolat, de a
kzgazdsz Debreu egy figyelemre mlt ttelnek ksznheten ez alapjn az gens rtkfggvnyt nagyon
egyszer formban felrhatjuk (Debreu, 1960):
Fontos
Ha az X1, , Xn tulajdonsgok klcsnsen preferencilisan fggetlenek, akkor az gens viselkedsi
preferencija lerhat a kvetkez fggvny maximalizlsval:
ahol minden egyes Vi egy rtkfggvny, amely csak az Xi attribtumnak a fggvnye. Pldul igen
valszn, hogy a repltri dnts meghozhat a kvetkez rtkfggvny alapjn:
V(Zaj, Kltsg, Hallesetek) = Zaj 104 Kltsg Hallesetek 1012
5. Dntsi hlk
Ebben az alfejezetben egy ltalnos mechanizmust fogunk megvizsglni a racionlis dntsek meghozatalra. A
felhasznlt eszkzt gyakran hatsdiagramnak (influence diagram) hvjk (Howard s Matheson, 1984), de mi
a tbbet sugall dntsi hlk (decision networks) elnevezst fogjuk hasznlni. A dntsi hlk a
cselekvsekhez s a hasznossgokhoz szksges jabb csomponttpusok hozzadsval tovbbfejlesztett
valsznsgi hlk. A repltri elhelyezsi problmt fogjuk hasznlni pldnak.
Ezeket a csompontokat gyakran rtkcsompontoknak (value nodes) nevezik az irodalomban. Mi jobbnak lttuk megtartani a
klnbsget a hasznossg- s az rtkfggvnyek kztt, ahogyan ezt korbban indokoltuk, ezrt lehet, hogy a kimeneti llapot egy
szerencsejtkot reprezentl.
4
524
Created by XMLmind XSL-FO Converter.
Sok esetben csupn egy egyszerstett formt hasznlunk. A jells ugyanaz marad, de az a vletlen csompont,
ami a kimeneti llapotot jelli, elmarad. Ehelyett, a hasznossgcsompontot kzvetlenl a jelenlegi llapot
csompontokhoz s a dntsi csomponthoz ktik. Ebben az esetben a hasznossgcsompont ahelyett, hogy az
llapotokon definilt hasznossgfggvnyt reprezentln, az egyes cselekvsekre vonatkoz vrhat
hasznossgokat reprezentlja, ahogy azt a (16.1) egyenlet definilja. Ezrt az ilyen tblkat
cselekvshasznossg tblknak (action-utility tables) nevezzk. A 16.6. bra a repltr problma
cselekvshasznossg-reprezentcijt mutatja.
Lthatjuk, hogy mivel a Zaj, a Hallesetek s a Kltsg vletlen csompontok a 16.5. brn a jvbeli
llapotokra vonatkoznak, ezek soha nem kaphatnak rtket, mint tnyvltozk. gy az egyszerstett verzi,
amibl elhagytuk ezeket a csompontokat, minden olyan esetben hasznlhat, amikor az ltalnosabb forma
hasznlhat. Br az egyszerstett forma kevesebb csompontot tartalmaz, az elhelyezs kimeneteleihez
kapcsold kzvetlen lersok elhagysa azt eredmnyezi, hogy kevsb rugalmas a krlmnyek esetleges
vltozsaira. Pldul a 16.5. brn a replgp zajszintjben bekvetkez vltozst a Zaj csompont feltteles
valsznsgi tbljnak megfelel megvltoztatsval lehet modellezni, ezzel szemben a zajszennyezs
fontossgnak a megvltozst a hasznossgfggvnyben a hasznossgtbla megvltoztatsval modellezhetjk.
Msfell a cselekvshasznossg diagramban 16.6. bra ltrejv minden ilyenfajta vltoztatst a
cselekvshasznossg tblzat megvltoztatsnak kell tkrznie. Lnyegben a cselekvshasznossg forma az
eredeti forma egy szerkesztett verzija.
525
Created by XMLmind XSL-FO Converter.
6. Az informci rtke
Fontos
Az elz elemzsben feltteleztk, hogy minden lnyeges informci, de legalbbis minden elrhet
informci az gens rendelkezsre ll. Gyakorlatban ez aligha trtnhet meg. A dntshozatal egyik
legfontosabb rsze, hogy tudjuk, milyen krdst kell feltenni. Pldul az orvos nem vrhatja el, hogy
rendelkezsre lljon minden lehetsges diagnosztikai teszt s krds eredmnye, amikor a pciens
elszr belp a rendelbe.5 A tesztek gyakran kltsgesek s nha veszlyesek (mind kzvetlenl, mind
az ltaluk okozott ksedelmek miatt). A fontossguk kt tnyezn mlik: egyrszt azon, hogy
Az Egyeslt llamokban az egyetlen krds, amit ez eltt mindig megkrdeznek, hogy a pciensnek van-e biztostsa.
526
Created by XMLmind XSL-FO Converter.
Teht a trsasgnak hajlandnak kell lennie, hogy akr C/n dollrt fizessen a szeizmolgusnak az informcirt:
az informci annyit r, mint maga a terlet.
Az informci rtke abbl a tnybl szrmazik, hogy az informcival valaki az aktulis helyzetben sokkal
alkalmasabb cselekedeteket tud megvlasztani. Az informcival lehetsgess vlik a helyzetek
megklnbztetse, ezzel szemben az informci nlkl a lehetsges helyzetek feletti tlagot nzve kell
cselekedni. ltalnosan fogalmazva, az informci rtkt a vrhat rtkek klnbsge definilja az
informci megszerzse eltt s utn.
Egy X vltozra vonatkoz nem teljes informcit modellezhetnk egy Y vltozrl szl teljes informcival, ahol az Y vltoz
valsznsgi kapcsolatban van X-szel. Erre ad pldt a 16.11. feladat.
6
527
Created by XMLmind XSL-FO Converter.
De Ej egy valsznsgi vltoz, aminek az rtke jelenleg nem ismert, gy tlagolnunk kell az sszes lehetsges
ejk rtkre, amelyeket Ej rtkeknt az Ej-re vonatkoz jelenlegi hiedelmnket felhasznlva megkaphatunk. Az Ej
megszerzsnek rtkt a kvetkezkppen definiljuk:
A formula megrtse rdekben gondoljuk t azt az egyszer esetet, mikor csak kt cselekvs, A1 s A2 kzl
lehet vlasztani. A cselekvsek jelenleg vrhat hasznossgai U1 s U2. Az Ej informci j vrhat
hasznossgokat,
-et s
fggetlennek felttelezett
Tegyk fel, hogy A1 s A2 kt klnbz utat jelent a hegyeken keresztl, tli idben. A1 egy knyelmes, egyenes
autplya egy alacsony hgn t, mg A2 egy tekervnyes fldt a cscson keresztl. Csak ezt az informcit
ismerve A1 egyrtelmen elnyben rszesthet, mivel elg valszn, hogy a msodik utat lavink zrjk le,
mikzben az els ton valsznleg nincsenek torldsok. U1 ezrt egyrtelmen nagyobb, mint U2. Az utak
aktulis llapotrl Ej mholdjelentseket kaphatunk, melyek
s
j vrhat rtkeket adnak az tkelkre
vonatkozan. A vrhat hasznossgrtkek eloszlst a 16.7. (a) bra mutatja. Nyilvnvalan ebben az esetben a
kltsgek miatt nem ri meg a mholdas jelentseket kikrni, mivel nagyon valszntlen, hogy ezek a
jelentsek a terv megvltozst eredmnyeznk. A tervek vltozatlansga mellett azonban az informcinak
nincs rtke.
Most ttelezzk fel, hogy kt, kiss eltr hosszsg kanyargs fldt kzl vlasztunk, s slyosan srlt
utasokat visznk. Ekkor br lehet, hogy U1 s U2 elg kzel esnek egymshoz, az
s
szles tartomnyon
bell vehetnek fel rtkeket. Jelents eslye van annak, hogy a msodik t tiszta lesz, mg az els le lesz zrva,
s ebben az esetben a hasznossgok klnbsge nagyon nagy lesz. A TI formula azt jelzi, hogy a
mholdjelentseket megri kikrni. Ezt a helyzetet a 16.7. (b) bra mutatja.
16.7. bra - Hrom ltalnos eset az informci rtkre. Az (a) esetben A1 majdnem
teljes bizonyossggal jobb marad A2-hz kpest, gy az informci nem szksges. A (b)
esetben a vlaszts nem egyrtelm, s az informci dnt fontossg. A (c) esetben a
vlaszts bizonytalan, de igazbl nem szmt, gy az informci is kevsb rtkes.
Ttelezzk most azt fel, hogy nyri idben vlasztunk a kt fldt kzl, amikor a lavink igen valszntlenek.
Ebben az esetben a mholdjelentsek azt mutathatjk, hogy az egyik tvonal ltvnyosabb, mint a msik, a
virgz hegyi rtek miatt, vagy taln csak nedvesebb az arra kanyarg patakok miatt. Ekkor igen valszn,
hogy ha megkapjuk ezt az informcit, megvltoztatjuk a tervnket. Azonban ebben az esetben, a klnbsg a
kt t kztt mg mindig igen kicsi, gy nem foglalkozunk a jelentsek megszerzsvel. Ezt a helyzetet a 16.7.
(c) bra mutatja.
Fontos
sszegzsl azt mondhatjuk, hogy az informcinak annyiban van rtke, amennyire valszn, hogy a
terv megvltozst okozza, s amennyire az j terv jelentsen jobb lesz, mint a rgi.
528
Created by XMLmind XSL-FO Converter.
TIE(Ej) 0
Az itt megadott gens az informcigyjts gynevezett rvidlt (myopic) formjt valstja meg. Ez azrt
van, mert az gens a TI formult rvidlt mdon hasznlja, azaz gy szmtja ki az informci rtkt, mintha
csak egyetlen tnyvltozt szerezne meg. Ha nincsen olyan tnyvltoz, ami sokat segtene, lehet, hogy a
rvidlt gens kapkod mdon belekezd egy cselekvsbe, pedig jobb lett volna elbb lekrdezni kt vagy
hrom vltozt, s csak aztn cselekedni. A rvidlt szablyozs ugyanazon a heurisztikn alapul, mint a moh
keress, s a gyakorlatban gyakran jl mkdik. (Pldul kimutattk, hogy diagnosztikai tesztek kivlasztsban
jobb a teljestmnye, mint az orvosszakrtknek.) Azonban egy teljesen racionlis informcigyjt gensnek
vgig kell gondolnia az sszes lehetsges informcikrs-szekvencit, ami egy kls akciban vgzdik, s
529
Created by XMLmind XSL-FO Converter.
ezeknek a krseknek az sszes lehetsges kimenetelt. Mivel a msodik krs rtke fgg az els krs
kimeneteltl, az gensnek fel kell dertenie a feltteles tervek tert, amint azt a 12. fejezetben lertuk.
530
Created by XMLmind XSL-FO Converter.
szakrtnek nehz volt ezeket kln kezelni, ezrt ssze kellett olvasztani, gy a Kezels olyan rtkeket vehet
fel, mint mtt egy hnapon bell. Ezt a modellt mutatja be a 16.9. bra.
Rgztse a valsznsgeket. A valsznsgek betegek adatbzisbl, szakirodalmi tanulmnyokbl vagy
szakrtk szubjektv becslseibl szrmazhatnak. Azokban az esetekben, amikor nem megfelel formban
rhetk el a szakirodalomban a valsznsgek, akkor Bayes-szabllyal s vettssel szmthatjuk ki a kvnt
rtkeket. Bebizonyosodott, hogy a szakrtk leginkbb egy ok hatsnak a valsznsgt tudjk megbecslni
(pldul P(nehzlgzs|szvelgtelensg)) sokkal inkbb, mint a msik irnyban.
Rgztse a hasznossgokat. Kevs szm kimenetel esetn ezek felsorolhatk s egyenknt kirtkelhetk.
Meghatrozhatunk egy sklt a legrosszabbtl a legjobb kimenetelig, mindegyikhez egy numerikus rtket
rendelve, pldul 1000-et az elhallozshoz s 0-t a teljes felplshez. Ekkor a tbbi kimenetel mr ezen a
skln elhelyezhet. Ezt elvgezheti egy szakrt, de jobb, ha a betegek (vagy gyermekek esetn a szleik) is
rszt vesznek ebben, mivel a klnbz embereknek klnbz preferenciik vannak. Exponencilisan sok
kimenetel esetn szksgnk van olyan mdszerekre, hogy tbbattribtum hasznossgfggvnyekkel
kombinlhassuk ket. Pldul feltehetjk, hogy a klnbz komplikcik negatv hasznossga additv.
Ellenrizze s finomtsa a modellt. A rendszer kirtkelshez szksgnk van helyes (bemenet, kimenet)
prokra; az gynevezett referencikra (gold standard), amihez lehet hasonltani. Ez orvosszakrt rendszerek
esetn azt jelenti, hogy sszehvjuk az elrhet legjobb orvosszakrtket, nhny beteg esett megmutatjuk
nekik, diagnzis fellltsra s kezelsi javaslat meghatrozsra krjk ket. Majd megnzzk, hogy a
rendszer mennyire illeszkedik a javaslataikhoz. Ha csak kevss, akkor megprbljuk a rosszul teljest rszeket
azonostani s megjavtani. Hasznos lehet a rendszert visszafel tesztelni. Ahelyett hogy a rendszerbe a
tneteket vinnnk be, s diagnzist krnk, vigyk be a diagnzist, mint pldul szvelgtelensg, s vizsgljuk
meg a tnetek, mint pldul szapora szvvers, jsolt valsznsgeit, s hasonltsuk ezt ssze szakirodalmi
adatokkal.
531
Created by XMLmind XSL-FO Converter.
Vgezzen rzkenysgvizsglatot. Ez a fontos lps azt ellenrzi, hogy a legjobb dnts rzkeny-e a megadott
valsznsgek s hasznossgok kis vltozsra, ehhez szisztematikusan vltoztassuk meg ezeket a
paramtereket, s futtassuk le a kirtkelst jra. Ha kis vltozsok jelentsen eltr dntst eredmnyeznek,
akkor lehet, hogy megri tbb energit rsznni, hogy pontosabb adatokat gyjtsnk. Ha minden vltoztats
ugyanahhoz a dntshez vezet, akkor a felhasznl biztos lehet, hogy ez a helyes dnts. Az
rzkenysgvizsglat klnsen fontos lehet, mivel az egyik f kritikja a szakrti rendszerek valsznsgi
megkzeltsnek, hogy nagyon nehz a szksges numerikus valsznsgek megbecslse. Az
rzkenysgvizsglat gyakran kimutatja, hogy sok numerikus rtket elg kzeltleg meghatrozni. Pldul
bizonytalanok lehetnk a P(tachycardia) a priori valsznsgben, de ha kiprblunk klnbz rtkeket erre a
valsznsgre, s minden egyes esetben a javasolt cselekmny a hatsdiagram alapjn ugyanaz, akkor kevsb
kell foglalkoznunk ezzel az ismerethinnyal.
8. sszefoglals
Ez a fejezet megmutatta, hogy hogyan kombinlhatjuk ssze a hasznossgelmletet a valsznsgekkel,
lehetv tve az gensnek olyan cselekvsek kivlasztst, amelyek maximalizlni fogjk a vrhat
teljestmnyt.
A valsznsg-elmlet (probability theory) elrja, hogy az gens a tnyei alapjn milyen hiedelmekkel
rendelkezzen, a hasznossgelmlet (utility theory) azt rja el, hogy az gens mit akar, a dntselmlet
(decision theory) pedig sszeilleszti a kettt, s elrja, hogy az gens mit tegyen.
532
Created by XMLmind XSL-FO Converter.
A dntselmlet felhasznlsval pthetnk egy olyan rendszert, ami a dntsek meghozatalakor figyelembe
veszi az sszes lehetsges cselekvst, s azt vlasztja ki, ami a legjobb vrhat kimenetelt adja. Egy ilyen
rendszert racionlis gensnek (rational agent) nevezhetnk.
A hasznossgelmlet megmutatja, hogy az gens, amelynek szerencsejtkok kztti preferencii eleget
tesznek bizonyos egyszer aximknak, lerhat egy hasznossgfggvnnyel; tovbb az gens a cselekvseit
gy vlasztja meg, mintha a vrhat hasznossgt maximalizln.
A tbbattribtum hasznossgelmlet (multiattribute utility theory) olyan hasznossgokkal foglalkozik,
amelyek az llapotok tbb, klnbz attribtumtl fggnek. A sztochasztikus dominancia (stochastic
dominance) egy klnsen hasznos technika egyrtelm dntsek meghozatalra mg az attribtumok
pontos hasznossgrtkei nlkl is.
A dntsi hlk (decision networks) egy egyszer formalizmust biztostanak a dntsi problmk lersra
s megoldsra. Ezek a valsznsgi hlk magtl rtetd kiterjesztsei dntsi s hasznossgi
csompontokkal a vletlen csompontokon tl.
Bizonyos esetekben a problma megoldshoz hozztartozik a tbbletinformci megszerzse a dnts
meghozatala eltt. Az informci rtkt (value of information) gy definiljuk, mint a vrhat hasznossg
javulst az informci nlkli helyzethez hasonltva.
Azok a szakrt rendszerek (expert systems), amelyek hasznossginformcikat is tartalmaznak,
tbbletkpessggel rendelkeznek a tisztn kvetkeztet rendszerekhez kpest. Azon tl, hogy dntseket
tudnak hozni, dnthetnek az informci megszerzsrl annak rtke alapjn, s kiszmthatjk dntseiknek
a valsznsgek s hasznossgok kis megvltozsra vonatkoz rzkenysgt.
rendszert tartalmaz, ami kpes kezelni a preferencik fggetlensgrl s feltteles fggetlensgrl szl
lltsokat, hogy elemezze a dntsi problma struktrjt. A sztochasztikus dominancit a kvalitatv
valsznsgi modellel Wellman vizsglta alaposan (Wellman, 1988; 1990a). Wellman s Doyle egy elzetes
vzlatt adja annak, hogy hogyan lehet felhasznlni hasznossg-fggetlensg relcik komplex halmazt a
hasznossgfggvny strukturlt modelljnek megalkotshoz, hasonlan ahhoz, ahogyan a valsznsgi hl az
egyttes valsznsgeloszls-fggvny strukturlt modelljt adja (Wellman s Doyle, 1992). Bacchus s
Grove, valamint La Mura s Shoham tovbbi eredmnyeket kzl ezzel kapcsolatban (Bacchus s Grove, 1995;
1996; La Mura s Shoham, 1999).
A dntselmlet mr az 1950-es vek ta szabvnyos eszkz a kzgazdasgtanban, a pnzgyben s a
menedzsment tudomnyban. Az 1980-as vekig az egyszer dntsi szitucik reprezentlsra a dntsi fk
voltak a f eszkzk. A dntsi hlkat vagy hatsdiagramokat Howard s Matheson vezette be (Howard s
Matheson, 1984), br a szksges fogalmakat mr korbban kifejlesztette egy csoport (benne Howard s
Matheson) az SRI-nl (Miller s trsai, 1976). Howard s Matheson eljrsa azonban egy kzbens lpst, a
dntsi hlnak egy dntsi fra trtn trst tartalmazta, ahol ltalnos esetben a fa exponencilis mret
volt. Shachter kifejlesztett egy eljrst, ami kzvetlenl a dntsi hlkon alapult anlkl, hogy egy kzbees
dntsi ft hozna ltre (Shachter, 1986). Ez az algoritmus volt az els, amely teljes kvetkeztetst tudott
elvgezni tbbszrsen sszekttt Bayes-hlkban. Egy mostani munkban Nilsson s Lauritzen
sszekapcsolta a dntsi hlkhoz tartoz algoritmusokat a Bayes-hlknl kifejlesztett klaszterezsi
algoritmusokkal (Nilsson s Lauritzen, 2000). Oliver s Smith gyjtemnye szmos hasznos cikket tartalmaz a
dntsi hlkrl, mint ahogy a Networks folyirat 1990-es klnkiadsa is hasznos cikkekbl ll (Oliver s
Smith, 1990). Dntsi hlkrl s hasznossgmodellezsrl szl cikkek a Management Science-ben is
rendszeresen megjelennek.
Az informcirtk-elmletet Ron Howard elemezte elszr (Howard, 1966). Ez a cikke a kvetkez
megjegyzssel r vget: Ha az informcirtk-elmlet s a hozz kapcsold dntselmleti struktrk a
jvben nem kpezik igen nagy rszt a mrnkk kpzsnek, akkor a mrnki szakma azt fogja ltni, hogy
hagyomnyos szerept, a tudomnyos s kzgazdasgi erforrsoknak az emberisg elnyre trtn kezelst,
egy msik szakma elorozta. A hivatkozott forradalom a vezetsi mdszerekben a mai napig nem kvetkezett
be, br ez vltozhat amint az informcirtk-elmlet felhasznlsa a bayesi szakrt rendszerekben
elterjedtebb vlik.
Az orvosi dntseknl trtn korai alkalmazsoktl eltekintve meglepen kevs MI-kutat alkalmazta a 13.
fejezetben trgyalt dntselmleti eszkzket. A kevs kivtelek egyike Jerry Feldman volt, aki a
dntselmletet a lts problmjra (Feldman s Yakimovsky, 1974) s a tervkszts problmjra (Feldman
s Sproull, 1977) alkalmazta. Az 1980-as vekben aztn hirtelen jra megntt az rdeklds az MI rszrl a
valsznsgi mdszerek irnt, a dntselmleti szakrt rendszerek szles krben elterjedtekk vltak (Horvitz
s trsai, 1988) valjban 1991-tl mg az Artificial Intelligence fedlapja is egy dntsi hlt brzolt, br
lve mvszi szabadsgukkal egyes nyilak irnyt megvltoztattk.
8.2. Feladatok
16.1.
(David Heckerman alapjn, de a magyar kiads Guinness Rekordok Knyvre alapozva [Guinness Rekordok
Knyve 1991, Solaris Kft., Budapest].) Ez a feladat az Almanac Game-hez kapcsoldik, amit dntselemzk
hasznlnak a numerikus becslsek kalibrlsra. Adjon becslst az albbi problmkra, azaz azt a szmot adja
meg, amirl gy gondolja, hogy ugyanolyan valsznsggel lehet tl nagy is, mint tl kicsi. Prblja meg
eltallni a 25 percentilises becslst is, azaz azt a szmot, amirl gy gondolja, hogy 25% eslye van, hogy tl
nagy lesz, s 75% eslye, hogy tl kicsi. Ugyangy tippelje meg a 75 percentilisest is. (gy minden egyes
krdsre hrom becslst kell megadnia sszesen egy kisebbet, a medint s egy nagyobb rtket.)
a. Melyik vben szlettek meg az els (nvad) szimi ikrek?
b. Hny helyi rtkig kpes valaki emlkezetbl visszaidzni a szmot?
c. Hny rk volt az eddig megfigyelt legnagyobb krill rajban?
d. A kkorszak ta a hborktl s a katasztrfktl eltekintve az elhallozsok hny szzalkrt felels a
malriasznyog?
534
Created by XMLmind XSL-FO Converter.
e. Az llatkertekben vgzett mrsek szerint egy kifejlett csimpnz hnyszor ersebb egy tlagos normlis
frfinl?
f. Az eddigi legmagasabb fellltott karcsonyfa magassga?
g. Milyen hossz a Csendes-cent tszel legrvidebb hajt hossza?
h. A Fld tlagos srsge hnyszorosa a vznek?
i. Egy vben tlagosan hny esetben szlelnek szeizmikus tevkenysget, ebbl mennyi rezheto, s mennyi
okoz krt?
j. Milyen magas a hmrsklet a Holdon a legjobban napsttte helyen (Egyenltre merlegesen)?
A helyes vlaszok a fejezet utols feladata utn tallhatk meg. A dntselemzs szempontjbl nem az az
rdekes, hogy az n medintippjei milyen kzel vannak a valdi vlaszokhoz, hanem inkbb az, hogy milyen
gyakran van a valdi rtk az n ltal tippelt 25%-os s 75%-os hatr kztt. Ha ez az esetek felnl gy van,
akkor a hatrai pontosak. De ha n az emberek tbbsghez hasonl, akkor a kelletnl magabiztosabb, s az
esetek felnl kevesebbszer lesz az igazi rtk az n ltal tippelt hatrokon bell. Ezen gyakorlssal javthat,
s gy hasznosabb informcit nyjthat a dntshozshoz. Prblja ki ezt a msodik krdssort, hogy lssa,
bekvetkezett-e valamilyen javuls:
a. Becslsek szerint Picasso hny kpet, illetve vzlatot festett az lete sorn?
b. Hny statiszta szerepel Sir Richard Attenborough Ghandi c., 1982-ben kszlt filmjnek temetsi
jelenetben?
c. Milyen magas a vilg legmagasabb ptmnye (varsi rditorony)?
d. Milyen hossz a transzszibriai vastplya?
e. Hny utas fordult meg az OHara chicagi repltren 1988-ban?
f. A vilg leglassabban mozg mechanikus szerkezete (ra) hny v alatt tesz meg egy fordulatot?
g. A dobozos sr piacra dobsnak ve?
h. A vilg legnagyobb tojsgyrban, a Croton Egg Farmon Amerikban a cg tykjai hny tojst tojnak
naponta?
i. Milyen volt a npsrsg 1968-ban Maca portugl tartomnyban, a vilg legsrbben lakott helyn?
j. A Man-szigeten lsezik a megszakts nlkl leghosszabb ideje fennll trvnyhozs. Az idn hny ves?
k. Mikor helyeztk zembe az els forgalomirnyt jelzlmpkat (Londonban)?
l. Mikor alakult a Nemzetkzi Labdarg Szvetsg (a FIFA)?
16.2.
Az llami szerencsejtk 1 dollrba kerl. Kt lehetsges dj van: 10 dollr 1/50 valsznsggel s 1 000 000
dollr 1/2 000 000 valsznsggel. Mennyi a szerencsejtkjegy vrhat pnzgyi rtke? Mikor racionlis (ha
van ilyen helyzet egyltaln) jegyet vsrolni? Pontosabban mutassa ezt be egy hasznossgokat tartalmaz
egyenlettel. Azt felttelezheti, hogy U(10 dollr) = 10 U(1 dollr), de U(1 000 000 dollr)-ra hasonlt nem
lehet felttelezni. Szociolgiai tanulmnyok mutatjk, hogy az alacsonyabb jvedelm emberek arnytalan
szm sorsjegyet vsrolnak. Mit gondol, ez azrt van, mert rosszabb dntshozk, vagy mert eltr
hasznossgfggvnyk van?
16.3.
J. Bernoulli 1738-ban vizsglta a szentptervri paradoxont, ami a kvetkez. Lehetsge nylik rszt venni egy
szerencsejtkban, amelyben egy szablyos rmt dobnak fel ismtelten az els fej elfordulsig. Ha az els fej
az n-edik dobsnl kvetkezik be, akkor a nyeremnye 2n dollr.
535
Created by XMLmind XSL-FO Converter.
536
Created by XMLmind XSL-FO Converter.
alapjn eldnti, hogy melyik autt vegye meg. Felttelezzk, hogy a vsrl akkor veszi meg a c1 autt, ha elg
id van legalbb egy teszt elvgzsre, tovbb, hogy c1-nek t1 a tesztje, s ez 50 dollrba kerl.
A kocsi j llapotban (q+ minsg) vagy rossz llapotban (q minsg) lehet, s a tesztek segthetnek a kocsi
llapotnak meghatrozsban. A c1 kocsi 1500 dollrba kerl, piaci rtke azonban 2000 dollr, ha j
llapotban van; ha nem, akkor 700 dollr szksges a j llapotba hozshoz. A vsrl gy becsli, hogy 70%
eslye van, hogy a kocsi j llapotban van.
a. Rajzolja fel a dntsi hlt, ami ezt a problmt reprezentlja.
b. Szmtsa ki a vrhat nett nyeresget c1 megvsrlsa esetn, ha nincsenek tesztek.
c. A tesztek azzal a valsznsggel jellemezhetk, hogy a kocsi tmegy-e a teszten vagy elbukik, attl
fggen, hogy j vagy rossz llapotban van. A kvetkez informcikkal rendelkeznk:
P(tmegy(c1, t1)|q+(c1)) = 0,8
P(tmegy(c1, t1)|q(c1)) = 0,35
Felhasznlva a Bayes-ttelt, szmtsa ki annak valsznsgt, hogy a kocsi tmegy (vagy elbukik) a teszten, s
gy azt a valsznsget, hogy j vagy rossz llapotban van adott tesztkimenetel esetn.
d. Szmtsa ki az optimlis dntst, ha tmegy, illetve ha elbukik, s szmtsa ki a vrhat hasznossgukat.
e. Szmtsa ki a teszt informcirtkt, s vezesse le a vsrl optimlis tervt.
16.12.
Bizonytsa be, hogy az informci rtke nem negatv s sorrendfggetlen, amint azt a 16.6. alfejezetben
lltottuk. Magyarzza el, hogyan lehetsges, hogy valaki rosszabb dntst hoz az informci megkapsa utn,
mint amit a megkapsa eltt hozott volna.
16.13.
Mdostsa s egsztse ki a Bayes-hls kdot a kdtrban, hogy kpes legyen dntsi hlkat ltrehozni s
kirtkelni, illetve kiszmtani az informci rtkt.
A 16.1. feladat vlaszai: Els sorozat: 1811, 40 ezer, 10 milli, 50%, 5-6, 67,36 m, 17 550 km, 5,515, 500 000,
100 000, 1000, 117,2 C. Msodik sorozat: 13 500, 300 000, 646,28 m, 9438 km, 56 281 000, 25 753, 1935, 3,7
milli, 28 343 f/km2, 1020, 1868, 1904.
537
Created by XMLmind XSL-FO Converter.
17.1. bra - (a) Egy egyszer 4 3-as krnyezet, ami az gens szmra szekvencilis
dntsi problma. (b) A krnyezet llapottmenet-modelljnek illusztrlsa: a
szndkolt kimenetel 0,8 valsznsggel kvetkezik be, de 0,2 valsznsggel az
gens oldalra mozdul a szndkolt irnyhoz kpest. A fallal val tkzskor nincsen
mozgs. A kt vgllapot jutalma a jelzett +1 s 1, az sszes tbbi llapot jutalma
0,04.
538
Created by XMLmind XSL-FO Converter.
Ha a problma determinisztikus volna, a megolds knny lenne: [Fel, Fel, Jobbra, Jobbra, Jobbra]. Sajnos a
krnyezet nem maradna mindig szinkronban ezzel a megoldssal, mivel a cselekvsek megbzhatatlanok. A
vletlenszer mozgs egy ltalunk elfogadott modelljt a 17.1. (b) bra mutatja be. Minden cselekvs 0,8
valsznsggel ri el a kvnt hatst, de a maradk esetben a cselekvsek az genst a kvnt irnytl jobbra
mozgatjk. Tovbb, ha az gens falba tkzik, akkor ugyanazon a mezn marad. Pldul ha az (1, 1) kezd
ngyzeten ll, a Fel cselekvs az genst az (1, 2)-re mozgatja 0,8 valsznsggel, de 0,1 valsznsggel a (2,
1)-re kerl, s 0,1 valsznsggel balra megy, ahol is falnak tkzik s (1, 1)-en marad. Egy ilyen krnyezetben
a [Fel, Fel, Jobbra, Jobbra, Jobbra] sorozat 0,85 = 0,32768 valsznsggel kerli meg az akadlyokat, s ri el
a (4, 3) clllapotot. Igen kis esllyel az is megtrtnhet, hogy a clt a msik ton keresztl ri el, 0,1 4 0,8, ami
sszessgben 0,32776 valsznsget jelent (lsd 17.1. feladat).
Az egyes llapotokban vgrehajtott egyes akciknak a kimeneti valsznsgeit llapottmenet-modellnek
(transition model) nevezzk, (vagy csak modell-nek, ha nem rtelemzavar). A T(s, a, s) jellst fogjuk
hasznlni annak a valsznsgnek a jellsre, hogy az s llapotban az a cselekvs vgrehajtsa s llapotot
eredmnyez. Feltesszk, hogy az tmenetek teljestik a 15. fejezetben megfogalmazott Markov-tulajdonsgot,
azaz, hogy s elrse s-bl csak s-tl fgg, ms korbbi llapotoktl mr nem. Egyelre a T(s, a, s)-t
tekinthetjk a valsznsgek egy nagy hromdimenzis tblzatnak. Ksbb, a 17.5. alfejezetben ltni fogjuk,
hogy az llapottmenet-modell reprezentlhat dinamikus Bayes-hlkkal (dynamic Bayesian network),
csakgy mint a 15. fejezetben.
Hogy teljess tegyk a feladat krnyezetnek a definilst, meg kell adnunk az gens hasznossgfggvnyt.
Mivel a dntsi problma szekvencilis, a hasznossgfggvny az llapotok sorozattl a krnyezeti
trtnettl (environment history) fog fggni, nem pedig egyetlen llapottl. A fejezetben ksbb
megvizsgljuk az ilyen hasznossgfggvnyek ltalnos megadst; egyelre egyszeren kiktjk, hogy az
gens minden s llapotban egy R(s) jutalmat (reward) kap, ami lehet pozitv vagy negatv, de mindenkppen
korltos. A konkrt pldnkban a jutalom minden llapotban 0,04, kivve a vgllapotokat (ahol +1 vagy 1).
Egy krnyezeti trtnet hasznossga (egyelre) egyszeren a kapott jutalmak sszege. Pldul ha az gens a +1
llapotot 10 lps utn ri el, akkor az sszhasznossga 0,6 lesz. A 0,04 negatv jutalom arra sztnzi az
genst, hogy minl gyorsabban rje el a (4, 3)-at, gy ez a problma a 3. fejezetbeli keressi problmk egy
sztochasztikus ltalnostsa. Ez ms megfogalmazsban gy hangzik, hogy az gens nem lvezi az letet ebben
a krnyezetben, s olyan gyorsan ki akar kerlni, amilyen gyorsan csak lehet.
Egy teljesen megfigyelhet krnyezetben megadott szekvencilis dntsi problmt Markov-llapottmenetmodelljvel s additv jutalmakkal Markov dntsi folyamatnak neveznek (MDF) (Markov decision
process). Egy MDF-et a kvetkez hrom sszetev hatroz meg:
Kezdllapot: S0
llapottmenet-modell: T(s, a, s)
539
Created by XMLmind XSL-FO Converter.
Jutalomfggvny:1 R(s)
A kvetkez krds az, hogyan nz ki egy megolds a problmra? Azt mr lttuk, hogy egy rgztett
cselekvssorozat nem oldja meg a problmt, mivel az gens vgl ms llapotba jut a clllapot helyett. Ezrt
egy megoldsnak minden, az gens ltal elrhet llapotra el kell rnia, hogy az gens mit tegyen. Egy
ilyenfajta megolds az eljrsmd (policy). Egy eljrsmdot ltalban -vel jellnk, s a eljrsmd az s
llapotban a (s) cselekvst javasolja. Ha az gens egy teljes eljrsmddal rendelkezik, akkor fggetlenl attl,
hogy egy cselekvsnek mi is a kimenetele, az gens mindig tudni fogja, mit tegyen a kvetkez alkalommal.
Egy adott eljrsmd kezdllapotbl indul vgrehajtsa minden alkalommal egy klnbz krnyezeti
trtnetet eredmnyez a krnyezet sztochasztikus volta miatt. Egy eljrsmd minsgt ezrt az adott
eljrsmd generlta lehetsges krnyezeti trtnetek vrhat hasznossgval mrik. Az optimlis eljrsmd
(optimal policy) az az eljrsmd, ami a legnagyobb vrhat hasznossgot eredmnyezi. Az optimlis
eljrsmdot *-gal jelljk. A * ismeretben az gens gy dnti el, hogy mit tegyen, hogy figyelembe veszi az
aktulis rzkelst, ami az aktulis s llapotot kzli vele, majd vgrehajtja a *(s) cselekvst. Az eljrsmd az
gens fggvnyt explicit mdon reprezentlja, s ezrt az voltakppen egy egyszer reflexgens lersa, amit
egy hasznossgalap gens ltal hasznlt informcikbl szmtunk ki.
A 17.1. brn mutatott vilg optimlis eljrst a 17.2. (a) bra mutatja. Lthat, hogy mivel egy lps kltsge
meglehetsen kicsi ahhoz a bntetshez viszonytva, hogy vletlenl a (4, 2) pozcira kerlnk, az optimlis
eljrsmd a (3, 1) llapot esetn vatos. Inkbb egy hossz kerl t megttelt javasolja, mint a rvid tvgst
a (4, 2) kockztatsval.
A kockzat s a jutalom egyenslynak megvltozsa fgg az R(s) rtktl a nem vgs llapotoknl. A 17.2.
(b) brn az R(s) rtknek ngy klnbz intervallumhoz tartoz optimlis eljrsmdot tallhatunk. Ha R(s)
1,6284, akkor az let anynyira elviselhetetlen, hogy az gens egyenesen a legkzelebbi kijrathoz tart, annak
ellenre, hogy ez 1 rtk. Amikor 0,4278 R(s) 0,0850, az let elg kellemetlen; az gens a +1
llapothoz vezet utat vlasztja, vllalva annak kockzatt, hogy esetleg a 1 llapotba kerl. Nevezetesen az
gens a (3, 1)-ben vlasztja az tvgst. Amikor az let csak kevss bnatos (0,0221 < R(s) < 0), az optimlis
eljrsmd nem vllal semmilyen kockzatot. A (4, 1) s (3, 2) llapotokban az gens teljesen elkerli a 1
llapotot, gy nem tud vletlenl beleesni, mg ha ez azt is jelenti, hogy elg sokszor beveri a fejt a falba.
Vgl, ha R(s) > 0, akkor az let kifejezetten lvezhet, s az gens mindkt kijratot elkerli. Mindaddig, amg
a (4, 1), (3, 2) s (3, 3) llapotokban a cselekvsek azok, amelyek az brn lthatk, minden eljrsmd
optimlis, s az gens vgtelen teljes jutalmat r el, mivel soha nem lp be a vgllapotba. Meglep mdon
megmutathat, hogy hat ms optimlis eljrsmd is ltezik az R(s) klnbz intervallumaira. A 17.7. feladat
kri majd ezek megkeresst.
17.2. bra - (a) Egy optimlis eljrsmd a sztochasztikus krnyezetre R(s) = 0,04
esetn nem vgllapotoknl. (b) Optimlis eljrsmdok R(s) ngy klnbz
rtktartomnya esetn.
Az MDF egyes defincii megengedik, hogy a jutalom fggjn a cselekvstl s a kimeneteltl is, gy a jutalomfggvny R(s, a, s) alak.
Ez nhny krnyezet lerst egyszersti, de a problmt alapveten nem vltoztatja meg.
1
540
Created by XMLmind XSL-FO Converter.
A kockzat s a jutalom vatos egyenslyozsa az MDF-ek egy olyan meghatroz tulajdonsga, ami nem
jelentkezik determinisztikus keressi problmknl; msfell ez meghatroz tulajdonsga szmos valsvilgbeli dntsi problmnak. Emiatt az MDF-eket szmos tudomnyterleten tanulmnyozzk, idertve az MI-t, az
opercikutatst, a kzgazdasgtant s a szablyozselmletet. Algoritmusok tucatjait javasoltk optimlis
eljrsmdok kiszmtsra. A 17.2. s 17.3. alfejezetben lerunk a legfontosabb algoritmuscsaldok kzl
kettt. Elszr azonban be kell fejeznnk a hasznossgok s eljrsmdok vizsglatt a szekvencilis dntsi
problmk esetben.
Fontos
Az els megvlaszoland krds az, hogy vges horizont (finite horizon) vagy vgtelen horizont
(infinite horizon) van a dntshozatalnl. A vges horizont azt jelenti, hogy ltezik egy rgztett N id,
ami utn semmi nem rdekes a jtknak vge, mondhatni. gy Uh([s0, ..., sN+k]) = Uh([s0, ..., sN])
minden k > 0 esetn. Pldul tegyk fel, hogy az gens (3,
1)-bl indul a 17.1. bra 4 3-as
vilgban, s tegyk fel, hogy N = 3. Ekkor, hogy a +1 llapot elrsnek legalbb az eslye
meglegyen, az gensnek egyenesen fel kell tartani, s az optimlis cselekvs a Fel. Ezzel szemben, ha
N = 100, akkor bsgesen van id a biztonsgos utat kvetni Balra menve. Azaz, vges horizont
esetben az optimlis cselekvs egy adott llapotban idvel vltozhat. Azt mondjuk, hogy az optimlis
eljrsmd vges horizont esetben nem- stacionrius (nonstationary). Rgztett idkorlt hinyban
ezzel szemben nincs ok klnbz viselkedsre ugyanabban az llapotban ms s ms idpontokban.
gy az optimlis cselekvs csak az aktulis llapottl fgg, s az optimlis eljrsmd stacionrius
(stationary). A vgtelen horizont esethez tartoz eljrsmdok ezrt egyszerbbek, mint a vges
horizont esethez tartozk, s ebben a fejezetben mi fknt a vgtelen horizont esettel foglalkozunk. 2
Vegyk szre, hogy a vgtelen horizont nem jelenti szksgszeren azt, hogy az sszes
llapotsorozat vgtelen; mindssze annyit jelent, hogy nincs egy rgztett hatr. Nevezetesen, egy
vgtelen horizont MDF-ben lehetnek vgllapotot tartalmaz vges llapotsorozatok.
A kvetkez eldntend krds az llapotsorozatok hasznossgnak a kiszmtsa. Tekinthetjk ezt a krdst a
tbbattribtum hasznossgelmlet (multiattribute utility theory) egy krdsnek (lsd 16.4. alfejezet)
azzal, hogy minden si llapotot az [s0, s1, s2, ...] llapotsorozat egy attribtumnak vesznk. Egy egyszer
kifejezs elrshez, ami az attribtumokbl pl fel, fel kell tteleznnk valamilyen preferenciafggetlensget.
A legtermszetesebb feltevs az, hogy az gens preferencii az llapotsorozatok kztt stacionriusok
(stationary). A preferencikra vonatkoz stacionarits a kvetkezket jelenti: ha kt llapotsorozat, [s0, s1, s2,]
s
A 17.1. bra 4 3-as vilga additv jutalmakat hasznl. Vegyk szre, hogy az additivitst hallgatlagosan
kihasznltuk az utak kltsgfggvnyeinek felhasznlsakor a heurisztikus keressi algoritmusokban (4.
fejezet).
2. Leszmtolt jutalmak (discounted rewards): egy llapotsorozat hasznossga ekkor
Ez a teljesen megfigyelhet krnyezetekre igaz. Ltni fogjuk, hogy a rszlegesen megfigyelhet krnyezetekben a vgtelen horizont esete
nem annyira egyszer.
2
541
Created by XMLmind XSL-FO Converter.
ahol a leszmtolsi tnyez (discount factor) egy 0 s 1 kztti szm. A leszmtolsi tnyez fejezi ki egy
gens preferencijt a jelenlegi s a jvbeli jutalmak kztt. Amikor kzel 0, akkor a tvoli jvbeli
jutalmakat jelentktelennek tekinti. Amikor rtke 1, akkor a leszmtolt jutalmak pontosan megegyeznek az
additv jutalmakkal, gy az additv jutalmak a leszmtolt jutalmak specilis esetei. A leszmtols j modellnek
tnik mind az llati, mind az emberi idbeli preferencikra. Egy leszmtolsi tnyez ekvivalens egy (1/ )
1 kamatlbbal.
A fejezet htralev rszben leszmtolt jutalmakat fogunk felttelezni, aminek okai hamarosan vilgosak
lesznek, br nha megengedjk a = 1 rtket.
A vgtelen horizont elfogadsa mgtt azonban rejlik egy problma: ha a krnyezet nem tartalmaz egy
vgllapotot, vagy ha az gens soha nem jut vgllapotba, akkor az sszes krnyezettrtnet vgtelen hossz
lesz, s a hasznossgok additv jutalmakkal ltalban vgtelenek lesznek. Abban egyetrthetnk, hogy a +
jobb, mint a , de kt + hasznossg llapotsorozat sszehasonltsa mr bonyolultabb. Hrom megolds
knlkozik, amelyek kzl kettt mr lttunk:
1. Leszmtolt jutalmakkal egy vgtelen sorozat hasznossga vges. Valjban, ha a jutalmakra ltezik egy Rmax
korlt s < 1, akkor azt kapjuk, hogy
2. rtkiterci
Ebben az alfejezetben az optimlis eljrsmd kiszmtsra mutatunk be egy algoritmust, az gynevezett
rtkitercit (value iteration). Az alaptlet az, hogy kiszmtjuk minden egyes llapot hasznossgt, majd az
llapothasznossgokat felhasznljuk az egyes llapotoknl az optimlis cselekvs megvlasztshoz.
542
Created by XMLmind XSL-FO Converter.
Felhasznlva ezt a defincit, egy llapot valdi hasznossga az U (s), amit U(s)-sel jellnk. Ez a a leszmtolt
jutalmak vrhat rtke akkor, amikor az gens egy optimlis eljrsmdot hajt vgre. Vegyk szre, hogy az
U(s) s az R(s) igen eltr mennyisgek: az R(s) a rvid tv jutalom az s-ben tartzkodsrt, mg az U(s) a
hossz tv sszjutalom s-tl kezdve. A 17.3. brn lthatk a hasznossgok a 4 3-as vilgban. Lthat,
hogy a hasznossgok nagyobbak a +1-es kijrathoz kzeli llapotoknl, mivel kevesebb lps szksges a
kijrat elrshez.
Az U(s) hasznossgfggvny lehetv teszi az gensnek, hogy a cselekvseit a 16. fejezetben szerepl
maximlis vrhat hasznossg elve alapjn vlassza meg; azt a cselekvst vlasztja, amelyik maximalizlja a
bekvetkez llapot vrhat hasznossgt:
Fontos
Most azonban, ha egy llapot hasznossga a leszmtolt jutalmak vrhat rtknek sszege attl a
kiindulponttl kezdve, akkor kzvetlen kapcsolat ll fenn egy llapot hasznossga s a
szomszdjainak a hasznossga kztt: egy llapot hasznossga az llapotban tartzkods kzvetlen
jutalmnak s a kvetkez llapot vrhat leszmtolt hasznossgnak az sszege, feltve, hogy az
gens az optimlis cselekvst vlasztja. Azaz egy llapot hasznossga a kvetkez:
543
Created by XMLmind XSL-FO Converter.
A (17.5) egyenletet Bellman-egyenletnek (Bellman equation) nevezik Richard Bellman tiszteletre (Bellman,
1957). Az llapotok hasznossgai mint a bekvetkez llapotsorozatok vrhat hasznossga a (17.3) egyenlet
szerint a Bellman-egyenletek egy rendszernek a megoldsai. Valjban ezek egyrtelm megoldsok,
ahogyan a kvetkez kt alfejezetben megmutatjuk.
Nzzk meg a 4 3-as vilg Bellman-egyenleteinek egyikt. Az (1, 1) llapothoz tartoz egyenlet:
U(1, 1) = 0,04 + max{0,8U(1, 2) + 0,1U(2, 1) + 0,1U(1, 1) (Fel)
0,9U(1, 1) + 0,1U(1, 2) (Balra)
0,9U(1, 1) + 0,1U(2,1) (Le)
0,8U(2, 1) + 0,1U(1, 2) + 0,1U(1, 1)} (Jobbra)
A 17.3. brn lthat szmok behelyettestsvel azt lthatjuk, hogy a Fel a legjobb cselekvs.
544
Created by XMLmind XSL-FO Converter.
Ha a Bellman-frisstst vgtelen sokszor alkalmazzuk, garantlt, hogy egyenslyi helyzetet rnk el (lsd
kvetkez alfejezet), s ekkor a vgs hasznossgrtkeknek a Bellman-egyenletek megoldst kell adniuk.
Valjban ezek egyrtelm megoldsok is, s a hozzjuk tartoz eljrsmd optimlis (amit a (17.4) egyenlettel
nyerhetnk). Az algoritmus, amit RTKITERCI-nak neveznk, a 17.4. brn lthat.
Az rtkitercit alkalmazhatjuk a 17.1. (a) bra 4 3-as vilgra. Nulla kezdeti rtkekrl indulva, a
hasznossgok alakulsa a 17.5. (a) brn lthat. Vegyk szre, ahogy a (4, 3) llapottl klnbz tvolsgra
lv llapotok negatv jutalmakat halmoznak fel egszen addig, amg egy bizonyos ponton utat tallnak a (4, 3)hoz, amikortl is a hasznossgok elkezdenek nvekedni. Az rtkiterci algoritmusra gondolhatunk gy, mint
loklis frisstsek ltali informciterjesztsre az llapottrben.
545
Created by XMLmind XSL-FO Converter.
Azt lltottuk, hogy az rtkiterci vgl a Bellman-egyenletek egy egyrtelm megoldshoz konvergl.
Ebben az alfejezetben kifejtjk, mirt is trtnik ez. Ennek sorn bevezetnk nhny hasznos matematikai
fogalmat, s olyan mdszereket kapunk, amelyek megbecslik a hasznossgfggvny hibjt , ha az algoritmust
hamar lltottuk le; ennek hasznossgt az adja, hogy nem kell vgtelen hosszan futtatnunk az algoritmust. Az
alfejezet a technikai rszleteket is bemutatja.
Az rtkiterci konvergencijnak megmutatsban hasznlt alapfogalom az sszehzs (contraction). Az
sszehzs nagyjbl egy olyan egyvltozs fggvny, ami kt klnbz bemeneti rtkre alkalmazva, kt
olyan kimeneti rtket ad, amelyek egymshoz kzelebbiek, mint az eredeti rtkek, legalbb egy bizonyos
lland mennyisggel. Pldul a kettvel val oszts egy sszehzs, mivel brmely kt szm elosztsa utn a
klnbsgk megfelezdik. Vegyk szre, hogy a kettvel val osztsnak van egy fix pontja, nevezetesen a
nulla, ami a fggvny alkalmazsval nem vltozik. Ebbl a pldbl az sszehzs kt fontos tulajdonsgt
vehetjk szre:
Egy sszehzsnak egyetlen fix pontja van: ha kt fix pontja lenne, nem kerlnnek egymshoz kzel a
fggvny alkalmazsakor, gy nem is volna sszehzs.
A fggvny tetszleges argumentumra trtn alkalmazsakor a fggvnyrtknek kzelebb kell kerlnik a
fix ponthoz (mivel a fix pont nem mozdul el), gy egy szszehzs ismtelt alkalmazsa a fix pontot adja
hatrrtkben.
Most tegyk fel, hogy a Bellman-frisstst (a (17.6) egyenletet) egy B opertornak tekintjk, aminek egyszeri
alkalmazsa az sszes llapot hasznossgt frissti. Jellje Ui az sszes llapot i-edik itercibeli
hasznossgnak a vektort. Ekkor a Bellman-frisstsi egyenletet felrhatjuk gy, hogy
Ui+1 BUi
Most egy olyan mdszerre van szksgnk, amellyel a hasznossgvektorok tvolsgt mrhetjk. A maximum
normt (max norm) fogjuk hasznlni, ami egy vektor hoszszt a legnagyobb komponensnek hosszval mri:
Fontos
Ezzel a defincival, a kt vektor kztti tvolsg ||U U|| az sszetartoz elemek kztti
klnbsgek maximuma. Az alfejezet f eredmnye a kvetkez: Legyen Ui s kt tetszleges
hasznossgvektor. Ekkor
||BUi BUi|| ||Ui Ui|| (17.7)
Ezrt, ha ||Ui U||-ra mint az Ui becsls hibjra tekintnk, ltjuk, hogy a hiba minden iterciban legalbb egy
tnyezvel cskken. Ez azt jelenti, hogy az rtkiterci exponencilisan gyorsan konvergl. A szksges
itercik szmt egy adott e hibahatr elrshez a kvetkezkppen szmthatjuk ki: elszr, a (17.1) egyenlet
szerint, az sszes llapot hasznossga korltos Rmax/(1 ) rtkkel. Ez azt jelenti, hogy a maximlis kezdeti
hiba ||U0 U|| 2Rmax/(1 ). Tegyk fel, hogy N itercit vgznk ahhoz, hogy a hiba legfeljebb rtk
legyen. Mivel a hiba minden egyes alkalommal legalbb -szorosra cskken, annak kell teljeslnie, hogy N 2
Rmax/(1 ) . Ha vesszk a kt oldal logaritmust, az addik, hogy
szm iterci elegend. A 17.5. (b) brn lthat, hogyan vltozik fggvnyben az N klnbz rtk
/Rmax hnyadosok esetben. A j hr az, hogy az exponencilis gyorsasg konvergencia miatt N nem fgg
tlsgosan az /Rmax hnyadostl. A rossz hr az, hogy N gyorsan n, ahogy kzel kerl 1-hez. gy gyors
546
Created by XMLmind XSL-FO Converter.
Fontos
Eddig az rtkiterci algoritmusa ltal visszaadott hasznossgfggvny hibjt elemeztk. Az genst
azonban igazn az rdekli, hogyan fog boldogulni, ha egy ilyen dntsfggvny alapjn hoz dntseket.
Tegyk fel, hogy az rtkiterci i-edik itercija utn az gens a valdi U hasznossgra egy Ui
becslst kap, s az Ui-n alapul egylpses elrenzs felhasznlsval (ahogy a (17.4) egyenletben)
megkapja a i MVH-eljrsmdot. Vajon a kiadd viselkeds megkzeltleg lesz-e olyan j, mint az
optimlis viselkeds? Ez dnt krds minden vals gens szmra, s bizonythat, hogy a vlasz
igen. Jellje
az eljrsmd vesztesge (policy loss) annak a maximlis rtke, amit az gens veszthet
-t vgrehajtva az optimlis * eljrsmd helyett. A i eljrsmd vesztesgt az Ui-beli hibhoz a
kvetkez egyenltlensg kapcsolja:
i
A gyakorlatban sokszor elfordul, hogy i jval hamarabb optimliss vlik, mieltt Ui konverglt
volna. A 17.6. brn lthat, ahogy a 4 3-as krnyezetben a maximlis Ui-beli hiba s az eljrsmd
vesztesge az rtkiterci folyamatnak elrehaladtval nullhoz kzelt, = 0,9 rtknl. A i
eljrsmd mr i = 4-nl optimlis, pedig az Ui-beli maximlis hiba mg 0,46.
547
Created by XMLmind XSL-FO Converter.
Most mr minden rendelkezsnkre ll, hogy az rtkitercit a gyakorlatban is felhasznljuk. Tudjuk, hogy a
helyes hasznossgokhoz konvergl, a hasznossg becslsnek hibjra korltokat tudunk adni, ha vges szm
iterci utn lellunk, s korltokat tudunk adni az eljrsmd vesztesgre, ami a becslt hasznossgrtkekhez
tartoz MVH-eljrsmd vgrehajtsa miatt lp fel. A vgs megjegyzs, hogy az sszes eredmny felttele
ebben az alfejezetben a < 1-gyel val leszmtols. Ha = 1 s a krnyezet tartalmaz vgllapotokat, akkor
bizonyos technikai felttelek teljeslse esetn konvergenciaeredmnyek s hibakorltok hasonl halmaza
szrmaztathat.
3. Eljrsmd-iterci
Az elz alfejezetben megfigyeltk, hogy optimlis eljrsmdot akkor is kaphatunk, amikor a
hasznossgfggvny becslse pontatlan. Ha egy cselekvs egyrtelmen jobb, mint a tbbi, akkor a relevns
llapotok hasznossgainak a pontos nagysgt nem szksges preczen tudnunk. Ez a megrzs egy alternatv
mdot javasol az optimlis eljrsmd megkeressre. Az eljrsmd-itercis (policy iteration) algoritmus
egy 0 kezdeti eljrsmdtl indulva a kvetkez kt lpst vltogatja:
Eljrsmd-rtkels (policy evaluation): Egy adott i eljrsmdnl szmtsuk ki
llapotok hasznossgt mintha i volna vgrehajtva.
-t, az egyes
548
Created by XMLmind XSL-FO Converter.
Pldul tegyk fel, hogy i a 17.2. (a) brn lthat eljrsmd. Ekkor azt kapjuk, hogy i(1, 1) = Fel, i(1, 2) =
Fel s gy tovbb, illetve az egyszerstett Bellman-egyenletek:
Ui(1, 1) = 0,04 + 0,8Ui(1, 2) + 0,1Ui(1, 1) + 0,1Ui(2, 1)
Ui(1, 2) = 0,04 + 0,8Ui(1, 3) + 0,2Ui(1, 2)
A lnyeges az, hogy ezek az egyenletek linerisak, mivel a max opertort eltvoltottuk. Ha az llapotok
szma n, n lineris egyenlet addik n ismeretlennel, ami egzakt mdon megoldhat O(n3) idben standard
lineris algebrai mdszerekkel.
amit k-szor ismtlnk, hogy a kvetkez hasznossgbecsls ellljon. Az add algoritmust mdostott
eljrsmd-itercinak (modified policy iteration) nevezzk. Ez gyakran sokkal hatkonyabb, mint a
szabvnyos eljrsmd-iterci vagy rtkiterci.
549
Created by XMLmind XSL-FO Converter.
Az eddig lert algoritmusok megkvetelik a hasznossgok vagy eljrsmdok sszes llapotbeli egyszerre
trtn frisstst. Megmutathat, hogy ez nem szigoran szksges. Valjban minden itercinl
kivlaszthatjuk az llapotok egy tetszleges rszhalmazt, s alkalmazhatjuk r brmelyik fajta frisstst
(eljrsmd-javtst vagy egyszerstett rtkitercit). Ezt az ltalnostott algoritmust aszinkron eljrsmditercinak (asynchronous policy iteration) nevezzk. A kezdeti eljrsmd s a hasznossgfggvny adott
felttelek melletti megvlasztsnl az aszinkron eljrsmd-iterci garantltan konvergl az optimlis
eljrsmdhoz. A feldolgozand llapotok megvlasztsnak szabadsga azt jelenti, hogy hatkonyabb
heurisztikus algoritmusokat tervezhetnk pldul olyan algoritmusokat, amelyek azon llapotok rtknek
frisstsre koncentrlnak, amelyeket egy j eljrsmd valsznleg elr. A vals letben ez nagyon
hasznosnak tnik: ha valakinek nincs szndkban a mlybe vetni magt egy sziklrl, akkor nem kell
aggdssal tltenie az idt a bekvetkez llapotok pontos rtkrl.
17.8. bra - (a) Az gens elhelyezkedsnek kezdeti valsznsgi eloszlsa. (b) tszri
Balra mozgs utn. (c) tszri Fel mozgs utn. (d) tszri Jobbra mozgs utn.
Az RMMDF-ek kezelshez elszr is megfelelen kell ket definilni. Egy RMMDF-nek az elemei
ugyanazok, mint egy MDF-nek egy T(s, a, s) llapottmenet-modell s egy R(s) jutalomfggvny , de van
egy O(s, o) megfigyelsi modellje (observational model) is, ami az s llapotban az o megfigyels
550
Created by XMLmind XSL-FO Converter.
rzkelsnek a valsznsgt adja meg.3 Pldul az rzkel nlkli gensnknek csak egyetlen megfigyelse
van (az res megfigyels), ami minden llapotban 1 valsznsggel bekvetkezik.
A 3. s 12. fejezetben nemdeterminisztikus s rszlegesen megfigyelhet tervksztsi problmkat
tanulmnyoztunk, s megllaptottuk, hogy a hiedelmi llapot (belief state) az aktulis llapotok halmaza,
amelyekben az gens lehet kulcsfogalom a megoldsok lersra s kiszmtsra.
Az RMMDF-ekben a fogalmat kiss finomtjuk. Egy b hiedelmi llapot most egy valsznsg-eloszls lesz az
sszes lehetsges llapot felett. Pldul a 17.8. (a) bra kezdeti hiedelmi llapota gy rhat, hogy
. A b hiedelmi llapot ltal az aktulis i llapothoz rendelt valsznsget b(s)-sel
jelljk. Az gens gy szmthatja ki a jelenlegi hiedelmi llapott, mint egy feltteles eloszlst az aktulis
llapotok felett, az eddigi megfigyelsek s cselekvsek sorozatnak ismeretben. Ez lnyegben a szrsi
(filtering) feladat (lsd 15. fejezet). A rekurzv szrsi alapegyenlet (lsd (15.3) egyenlet a 2.1. szakasz - Szrs
s elrejelzs rszben) megmutatja, hogy hogyan szmolhatjuk ki az j hiedelmi llapotot az elz hiedelmi
llapotbl s az j megfigyelsbl. Az RMMDF-eknl a jells eltr, s meg kell gondolni mg a cselekvst is,
de az eredmny lnyegben ugyanaz. Ha b(s) volt az elz hiedelmi llapot, s az gens az a cselekvst hajtja
vgre s az o megfigyelst rzkeli, akkor az j hiedelmi llapot a kvetkez:
ahol a egy normalizcis konstans, ami a hiedelmi llapot 1-re sszegzst biztostja. Ezt az egyenletet gy
rvidthetjk, hogy b = ELRE(b, a, o).
Fontos
A RMMDF-ek megrtshez szksges lnyegi meglts pedig ez: az optimlis cselekvs csak az
gens aktulis hiedelmi llapottl fgg. gy az optimlis eljrsmd lerhat a hiedelmi llapotok
cselekvsekre trtn *(b) lekpzsvel. Ez nem fgg az gens aktulis llapottl, amiben
tartzkodik. Ez hasznos tulajdonsg, mivel az gens nem ismeri az aktulis llapott; csupn a hiedelmi
llapott. Ekkor egy RMMDF gens dntsi ciklusa a kvetkez:
1. Adott jelenlegi b hiedelmi llapot esetn hajtsuk vgre az a = * (b) cselekvst.
2. Fogadjuk az o megfigyelst.
3. lltsuk a jelenlegi llapothiedelmet ELRE(b, a, o)-ra, s ismteljk meg a ciklust.
Most gy gondolhatunk az RMMDF-ekre, mint amelyek keresst ignyelnek a hiedelmi llapotok
terben, pontosan gy, ahogy az rzkel nlkli s az eshetsgi problmkra vonatkoz mdszerek a
3. fejezetben. A f klnbsg az, hogy az RMMDF hiedelmi llapot tere folytonos, mivel egy RMMDF
hiedelmi llapot egy valsznsgi eloszls. Pldul a hiedelmi llapot a 4 3-as vilg esetben egy
pont a 11 dimenzis folytonos trben. Egy cselekvs megvltoztatja a hiedelmi llapotot is, nemcsak a
fizikai llapotot, gy kirtkelse aszerint az informci szerint trtnik, amit a cselekvs
eredmnyeknt az gens megszerez. Az RMMDF-ekbe ezrt beletartozik az informci rtke is (16.6.
alfejezet) mint a dntsi problma egy komponense.
Nzzk meg tzetesebben a cselekvsek kimenetelt. Nevezetesen, szmtsuk ki annak valsznsgt, hogy az
gens a b hiedelmi llapotbl a b hiedelmi llapotba jut az a cselekvs vgrehajtsa utn. Ekkor, ha ismernnk a
cselekvst s a bekvetkez megfigyelst, akkor a (17.11) egyenlet a hiedelmi llapot egy determinisztikus
frisstst adn: b = ELRE(b, a, o). Termszetesen a bekvetkez megfigyels mg nem ismert, gy az gens a
szmos lehetsges hiedelmi llapot egyikbe, b-be kerlhet az elfordul megfigyels fggvnyben. Az o
rzkelsnek valsznsge, feltve hogy a b hiedelmi llapotban az a cselekvs kerlt vgrehajtsra, az sszes
olyan s aktulis llapot feletti sszegzssel addik, amelyeket az gens elrhet:
A megfigyelsi modell alapveten azonos az idbeli folyamatok rzkel modelljvel (sensor model) a 15. fejezetbl. Ahogyan az MDFek jutalomfggvnynl, a megfigyelsi modell szintn fgghet a cselekvstl s a kimeneteli llapottl, de ez most sem egy alapvet
vltozs.
3
551
Created by XMLmind XSL-FO Converter.
Jellje (b, a, b) annak a valsznsgt, hogy b-bl b-be jutunk egy a cselekvssel. Ennek felhasznlsval
ekkor
Fontos
A (17.2.) egyenletet felfoghatjuk egy llapottmenet-modellnek a hiedelmi llapot trben.
Definilhatunk egy jutalomfggvnyt is a hiedelmi llapotokra (azaz azon aktulis llapotok vrhat
jutalmt, amelyekben az gens lehet):
gy lthatan (b, a, b) s (b) egytt egy megfigyelhet MDF-et definil a hiedelmi llapotok tern.
Tovbb megmutathat, hogy egy *(b) optimlis eljrsmd erre az MDF-re, szintn optimlis
eljrsmd az eredeti RMMDF-re. Mshogy fogalmazva, egy RMMDF megoldsa a fizikai
llapottrben reduklhat egy MDF megoldsra a hozz tartoz hiedelmi llapot trben. Ez a tny
taln kevsb meglep, arra gondolva, hogy a hiedelmi llapot definci szerint az gens szmra
mindig megfigyelhet.
Vegyk szre, hogy br az RMMDF-eket sikeresen redukltuk az MDF-ekre, a kapott MDF-eknek folytonos (s
ltalban sokdimenzis) llapotterk van. A 17.2. s 17.3. alfejezetekben lert algoritmusok egyike sem
alkalmazhat kzvetlenl ilyen MDF-ekre. Kiderlt, hogy az rtk- s eljrsmd-itercinak kifejleszthetk
olyan vltozatai, amelyek folytonos llapot MDF-ekre is alkalmazhatk. Az alaptlet az, hogy egy (b)
eljrsmd reprezentlhat a hiedelmi llapot tr olyan rszeinek egy halmazaknt, amelyek mindegyikhez egy
adott optimlis cselekvs tartozik.4 Az rtkfggvny b klnbz lineris fggvnyt rendeli az egyes
trrszekhez. Minden rtk- s eljrsmd-itercis lps finomt a trrszek hatrain, s j trrszeket vezethet
be.
Az algoritmus rszletei meghaladjk a knyv kereteit, de megadjuk a megoldst az rzkelmentes 4 3-as
vilgra. Az optimlis eljrsmd a kvetkez:
[Balra, Fel, Fel, Jobbra, Fel, Fel, Jobbra, Fel, Fel, Jobbra, Fel, Jobbra, Fel, ]
Az eljrsmd egy sorozat, mivel ez a problma determinisztikus a hiedelmi llapotok terben nincsenek
megfigyelsek. Azt a trkkt alkalmaztuk, hogy az gens egyetlen Balra mozgssal biztostja, hogy nincs (4,
1)-ben, azrt, hogy aztn meglehets biztonsggal mozoghasson Fel s Jobbra a +1 kijrat elrshez. Az gens
a +1 kijratot 86,6% gyakorisggal ri el, s sokkal gyorsabban, mint az alfejezet elejn megadott eljrsmd
esetn, gy a vrhat hasznossga 0,38, szemben az elz 0,08-as rtkvel.
Bonyolultabb RMMDF-eknl, amikor megfigyelsek is vannak, nagyon nehz (valjban PSPACE-beli azaz
valban nagyon nehz) kzeltleg optimlis eljrsmdokat tallni. A problmk nhny tucat vltozval
gyakran kivitelezhetetlenek. A kvetkez alfejezet egy eltr kzelt mdszert r le RMMDF-ek megoldsra,
ami az elrenz keressen alapul.
Bizonyos RMMDF-ekre az optimlis eljrsmdhoz vgtelen szm trrsz tartozik, gy az egyszer trrszek listja megkzelts nem
mkdik, s tletesebb mdszerek szksgesek mg egy kzelts megtallshoz is.
4
552
Created by XMLmind XSL-FO Converter.
5. Dntselmleti gensek
Ebben a fejezetben egy tfog szemlletmdot vzolunk fel az gensek megtervezsre rszlegesen
megfigyelhet, sztochasztikus krnyezetek esetn. A tervezs alapelemei mr ismertek:
Az llapottmenet- s megfigyelsi modelleket egy dinamikus Bayes-hlval (dynamic Bayesian network)
brzoljuk (a 15. fejezetben lertak szerint).
A dinamikus Bayes-hl kiegszlt dntsi s hasznossgi csompontokkal, amelyek megegyeznek a 16.
fejezetben szerepl dntsi hlkban hasznlatosakkal. A kirajzold modellt dinamikus dntsi hlnak
vagy DDH-nak (dynamic decision network, DDN) nevezzk.
Egy szrsi algoritmust hasznlunk az j rzkelsek s cselekvsek befogadsra s a hiedelmi llapot
reprezentcijnak a frisstsre.
Dntseket hozunk lehetsges cselekvssorozatok elgondolsval s a legjobb kivlasztsval.
Egy dinamikus Bayes-hl felhasznlsnak elsdleges haszna az llapottmenet- s rzkel modellek
brzolsnl az, hogy felbontja az llapotlerst valsznsgi vltozk egy halmazra, hasonlan ahhoz, ahogy
a tervksztsi algoritmusok logikai brzolst vesznek ignybe az llapottr felbontsra, amit a keressi
algoritmusok hasznlnak. Az gensterv ezrt a 2. fejezetben vzolt hasznossgalap gens egy gyakorlati
megvalstsa.
Mivel dinamikus Bayes-hlkat hasznlunk, visszatrnk a 15. fejezetbeli jellshez, ahol Xt az llapotvltozk
egy halmazt jellte egy t idpillanatban, Et pedig a bizonytkvltozkat. gy ahol ebben a fejezetben eddig st-t
hasznltunk (a t-beli llapotra), mostantl Xt-t fogunk hasznlni. A t-beli cselekvst At-vel fogjuk jellni, gy a
T(s, a, s) llapottmenet-modell ugyanaz, mint a P(Xt+1|Xt, At), s az O(s, o) megfigyelsi modell ugyanaz, mint
a P(Et|Xt). A t idpontban kapott jutalmat jelljk Rt-vel, s Ut-vel az llapot hasznossgt a t idpontban. E
szerint a jells szerint egy dinamikus dntsi hl a 17.9. brn lthat mdon nz ki.
A dinamikus dntsi hlk tmr lerst biztostanak nagy RMMDF-ekre, gy brmely RMMDF algoritmus
bemenetl szolglhatnak, idertve az rtk- s eljrsmd-itercira val mdszereket is. Ebben az alfejezetben
az elrenz mdszerekre sszpontostunk, amelyek cselekvssorozatokat kpzelnek el a jelenlegi hiedelmi
llapottl kiindulva, nagyon hasonlan a 6. fejezetbeli jtkok algoritmusaihoz. A 17.9. brn a hl hrom
jvbeli lpsig elkpzelve szerepel; a jelenlegi s a jvbeli dntsek s a jvbeli megfigyelsek s jutalmak
mind ismeretlenek. Figyeljk meg, hogy a hl csompontokat tartalmaz az Xt+1 s Xt+2-beli jutalmakra, de
hasznossgot az Xt+3 esetben. Ez azrt van gy, mert az gensnek maximalizlnia kell az sszes jvbeli
jutalom (leszmtolt) sszegt, s U(Xt+3) reprezentlja az Xt+3-hoz tartoz s az sszes ezt kvet jutalmat.
Ahogyan a 6. fejezetben, most is feltesszk, hogy U-nak csak egy kzelt alakja rhet el: ha elrhetk
lennnek pontos hasznossgrtkek, akkor nem lenne szksg 1 lpsnl hosszabb elretekintsre.
553
Created by XMLmind XSL-FO Converter.
A 17.9. brn lthat DDH-hoz tartoz hromlpses elrenz keressi fa egy rszt a 17.10. bra mutatja.
Mindegyik hromszg alak csompont egy olyan hiedelmi llapot, amiben az gens egy At+i dntst hoz i = 0,
1, 2, ... esetn. A kerek csompontok a krnyezet vlaszaihoz tartoznak, nevezetesen hogy milyen Et+i
megfigyels fog felbukkanni. Lthat, hogy nincsen vletlen csompont, ami a cselekvsek kimenetelhez
tartozna. Ez azrt van gy, mert egy cselekvsnl a hiedelmi llapot frisstse a konkrt kimeneteltl fggetlenl
determinisztikus.
A hiedelmi llapot az egyes hromszg csompontoknl kiszmthat egy szrsi algoritmusnak a hozzvezet
megfigyelsek s cselekvsek sorozatn val alkalmazsval. Ezzel a mdszerrel, az algoritmus figyelembe
veszi azt a tnyt, hogy egy At+i dntsnl az gens szmra elrhetk lesznek az Et+1, ..., Et+i rzkelsek, mg ha
a t idpontban nem is tudja, hogy ezek az rzkelsek mi is lesznek. Ezen a mdon a dntselmleti gens
automatikusan figyelembe veszi az informci rtkt s informcigyjt cselekvseket hajt vgre, ha
szksges.
Egy dnts a keressi fbl a levelek hasznossgrtknek htrafel terjesztsvel nyerhet ki, a vletlen
csompontoknl tlagot, a dntsi csompontokban pedig maximumot szmtva. Ez hasonl a vletlen
csompontokkal rendelkez jtkfkra vonatkoz VRHATMINIMAX algoritmushoz, kivve, hogy (1) nem csak
levlllapotokban lehet jutalom, s (2) a dntsi csompontok hiedelmi llapotokhoz, s nem aktulis
llapotokhoz tartoznak. A d mlysg kimert keress idkomplexitsa O(|D|d |E|d), ahol |D| az elrhet
cselekvsek szma, |E| pedig a lehetsges megfigyelsek szma. Olyan problmknl, ahol a leszmtolsi
tnyez nincs kzel 1-hez, gyakran elegend sekly keress az optimlishoz kzeli dnts megtallshoz. Az is
lehetsges, hogy az tlagszmts lpst a lehetsges megfigyelsek mintavtelezsvel kzeltjk, az sszes
lehetsges megfigyels feletti sszegzs helyett. Szmos ms mdja van j kzelt megoldsok gyors
megtallsnak, de ezeket a 21. fejezetre hagyjuk.
A dinamikus dntsi hl alap dntselmleti genseknek szmos elnye van ms, egyszerbb, a korbbi
fejezetekben bemutatott gensfelptsekhez kpest. Nevezetesen, rszlegesen megfigyelhet s sztochasztikus
krnyezeteket kezelnek, s knnyen fellbrljk a terveiket a vratlan esemnyek kezelshez. Megfelel
rzkel modellekkel kpesek kezelni az rzkelmeghibsodst, s kpesek megtervezni az informci
begyjtst. Az id szortsban s komplex krnyezetekben teljestmnyromlsuk fokozatos, klnbz
kzelt technikk kihasznlsval. gy jogos a krds, hogy mi is hinyzik mg? A DDH-alap
algoritmusunknak a legkomolyabb hinyossga az elrefel keresstl val fggs, ahogyan a II. rszbeli
llapottr-keressi algoritmusoknak is. A IV. rszben elmagyarztuk, hogy rszlegesen rendezett, absztrakt
tervek mrlegelsnek kpessge clirnyos keresssel hogyan biztostotta a problmamegold kpessg lnyegi
nvekedst, klnsen a tervknyvtrakkal sszeillesztve. Ezeket a mdszereket megksreltk a valsznsgi
terletre is kiterjeszteni, de ez eddig nem bizonyult hatkonynak. Egy msodik, kapcsold problma a DDH
nyelv alapvet kijelentslogikai termszete. Szeretnnk, ha az elsrend valsznsgi nyelvek elkpzelseit
(lsd 14.6. alfejezet) ki tudnnk terjeszteni a dntshozatal problmjra. A jelenlegi kutatsok azt mutatjk,
hogy ez a kiterjeszts lehetsges, s jelents elnyket rejt magban, ahogy ezt a fejezet vgi megjegyzseknl
megtrgyaljuk.
17.10. bra - A 17.9. brn lthat DDH elrenz megoldsnak egy rsze
554
Created by XMLmind XSL-FO Converter.
A snblijtk az ellenrzsi jtk (inspection game) egy szabadids vltozata. Ilyen jtkokban az ellenr megvlaszt egy napot egy
ltestmny (mint pldul egy vendgl vagy egy biolgiai fegyvergyr) ellenrzsre, s a ltestmny mkdtetje szintn megvlaszt egy
napot, amikor az sszes kellemetlen dolgot elrejti. Az ellenr gyz, ha a napok klnbznek, s a ltestmny fenntartja, ha ugyanazok.
5
555
Created by XMLmind XSL-FO Converter.
Pldul a jobb als sarokban az lthat, amikor O a kett cselekvst s E szintn a kett cselekvst vlasztja, a
jutalom E-nek 4, O-nak pedig 4.
Minden jtkosnak a jtkban vlasztania kell, s aztn vgrehajtani egy stratgit (strategy) (ami a 16.
fejezetben szerepl eljrsmd elnevezse a jtkelmletben). A tiszta stratgia (pure strategy) egy
determinisztikus eljrsmd, ami mindegyik helyzethez elr egy vgrehajtand konkrt cselekvst; az
egylpses jtkokban a tiszta stratgia csupn egyetlen cselekvs. A jtkok elemzse vezetett el a kevert
stratgik (mixed strategy) gondolathoz, amely eljrsmdban egy konkrt cselekvs vletlenszeren kerl
kivlasztsra egy adott eloszlsbl a cselekvsek felett. Azt a kevert stratgit, ami p valsznsggel az a
cselekvst, egybknt pedig a b-t vlasztja, gy jelljk, hogy [p: a; (1 p): b]. Pldul a ktujjas snblijtkban
egy lehetsges kevert stratgia a [0,5: egy; 0,5: kett]. A stratgiaprofil (strategy profil) egy hozzrendels,
ami mindegyik jtkoshoz egy stratgit rendel; adott stratgiaprofilnl a jtk kimenetele (outcome) egy
numerikus rtk mindegyik jtkoshoz.
Egy jtk megoldsa (solution) egy olyan stratgiaprofil, amiben minden jtkos egy racionlis stratgit fogad
el. Ltni fogjuk, hogy a jtkelmletben a legfontosabb krds a racionlis jelentsnek a definilsa akkor,
amikor mindegyik gens csak egy rszt vlasztja meg a kimenetelt meghatroz stratgiaprofilnak. Fontos azt
felismerni, hogy a kimenetelek a jtk egyes meneteinek a konkrt eredmnyei, mg a megoldsok a jtk
elemzshez hasznlt elmleti konstrukcik. Megmutatjuk, hogy bizonyos jtkoknak csak a kevert stratgik
kztt van megoldsa. Ez azonban nem jelenti azt, hogy egy jtkosnak sz szerint egy kevert stratgit kell
elfogadnia a racionlis viselkedshez.
Gondoljuk t a kvetkez trtnetet: kt lltlagos betrt, Alizt s Bendegzt tetten rik egy betrs
helysznhez kzel, s a rendrsg kln-kln kihallgatja ket. Mindketten tudjk, hogy ha mindketten
beismerik a bncselekmnyt, akkor 5 v brtnt kapnak betrsrt, de ha mindketten tagadnak, akkor csak 1
vet kapnak lopott holmik birtoklsnak enyhbb vdjval. Azonban a rendrsg kln-kln alkut ajnl
mindkettnek: ha a partneredrl tanstod, hogy egy betrbanda vezetje, akkor szabadon engednek, mg a
partnered 10 vet kap. Ekkor Aliz s Bendegz az gynevezett fogolydilemmval (prisoners dilemma)
szembeslnek: tanskodniuk kell vagy tagadniuk? Racionlis gensknt Aliz s Bendegz is a sajt vrhat
hasznossgt akarja maximlni. Tegyk fel, hogy Alizt teljessggel hidegen hagyja partnernek a sorsa, gy az
hasznossga a sajt brtnben tlttt veinek szmval arnyosan cskken, fggetlenl attl, hogy mi trtnik
Bendegzzal. Bendegz teljesen hasonlan rez. A racionlis dnts meghozatalhoz mindketten megalkotjk a
kvetkez jutalommtrixot:
556
Created by XMLmind XSL-FO Converter.
Aliz a kvetkezkppen elemzi a jutalommtrixot: Tegyk fel, hogy Bendegz tanskodik. Ha tanskodom, 5
vet kapok, s 10 vet, ha nem, ebben az esetben a tanskods jobb. Msrszrl, ha Bendegz tagad, akkor 0
vet kapok, ha tanskodom, s 1 vet, ha tagadok, gy a tanskods ebben az esetben is jobb. gy mindkt
esetben szmomra jobb tanskodni, gy ez az, amit tennem kell.
Aliz felfedezte, hogy a tanskods a jtk dominns stratgija (dominant strategy). Azt mondjuk, hogy egy
p jtkos egy s stratgija ersen dominlja (strongly dominate) az s stratgit, ha az s kimenetele p szmra
jobb, mint az s kimenetele, a tbbi jtkos minden stratgiavlasztsa esetn. Egy s stratgia gyengn
dominlja (weakly dominates) s-t, ha s jobb, mint s legalbb egy stratgiaprofilnl, s nem rosszabb a
tbbiben. Egy dominns stratgia olyan stratgia, ami az sszes tbbit dominlja. Egy ersen dominlt stratgit
irracionlis kvetni, s ha ltezik, irracionlis eltrni a dominns stratgitl. Racionlis volta miatt Aliz a
dominns stratgit vlasztja. Mr csak egy kevs terminolgira van szksgnk a tovbbhaladshoz: egy
kimenetelt Pareto-optimlisnak (Pareto optimal) neveznk,6 ha nincs msik kimenetel, amit az sszes jtkos
preferlna. Egy kimenetel Pareto-dominlt (Pareto dominated) egy msik kimenetel ltal, ha az sszes jtkos
a msik kimenetelt preferln.
Ha Aliz okos s racionlis, folytatni fogja az rvelst a kvetkezkppen: Bendegz dominns stratgija
szintn a tanskods. gy is tanskodni fog, s mindketten 5 vet kapunk. Amikor mindegyik jtkosnak van
dominns stratgija, ezek kombincijt dominns stratgiai egyenslynak (dominant strategy equilibrium)
nevezzk. ltalban egy stratgiaprofil akkor van egyenslyi helyzetben (equilibrium), ha egyik jtkos sem
nyer stratgija vltsval, az sszes tbbi jtkos stratgijnak vltozatlansga mellett. Egy egyenslyi helyzet
lnyegben egy loklis optimum (local optimum) az eljrsmdok terben: egy cscs teteje lejtkkel minden
dimenziban, ahol a dimenzik egy jtkos stratgiai vlasztsaihoz tartoznak.
A dilemma a fogolydilemmban az, hogy az egyenslyi helyzet kimenetele mindkt jtkosnak rosszabb, mint
az a kimenetel, amit akkor rnnek el, ha mindketten megtagadnk a tanskodst. Mskppen fogalmazva, az
egyenslyi megolds kimenete Pareto-dominlt a (tagad, tagad)-nak a (1, 1)-es kimenetelvel.
Van-e mdja Aliznak s Bendegznak a (1, 1)-es kimenetelt elrni? Az bizonyosan megengedett lehetsg
mindkettjknek, hogy megtagadjk a tanskodst, de valszntlen lehetsg. Akrmelyik jtkos is kezdene
elmlkedni azon, hogy a tagadst vlasztja, felismeri, hogy jobban teszi, ha a tanskodik. Az egyenslyi
helyzetnek ez a vonzereje.
Fontos
A matematikus John Nash (1928) bebizonytotta, hogy minden jtknak van egy itt definilt tpus
egyenslyi helyzete. Ezt a tiszteletre most mr Nash-egyenslynak nevezik. Nyilvnval, hogy egy
dominns stratgiai egyensly Nash-egyensly (Nash equilibrium) (lsd 17.9. feladat), de nem
minden jtknak vannak dominns stratgii. Nash ttele azt mondja ki, hogy egyenslyi stratgik
akkor is lteznek, ha nincs dominns stratgia.
A fogolydilemmnl csak a (tanskodik, tanskodik) stratgiaprofil Nash-egyensly. Nehezen lthat, hogy
racionlis jtkosok hogyan tudjk elkerlni ennek a kimenetelt, mivel brmely javasolt nem egyenslyi
megoldsnl legalbb egy jtkos ksrtsben lenne, hogy vltoztasson a stratgijn. Jtkelmleti kutatk
egyetrtenek, hogy a Nash-egyensly fennllsa szksges felttel egy megolds fennllshoz br abban mr
nem rtenek egyet, hogy ez elgsges felttel-e.
A (tanskodik, tanskodik) megolds knnyszerrel elkerlhet, ha valamilyen mdon megvltoztatjuk a jtkot
(vagy a jtkosokat). Mdosthatjuk pldul egy olyan iterlt jtkra, amiben a jtkosok tudjk, hogy jra
tallkozni fognak (de az dnt, hogy bizonytalanok legyenek abban, hogy hnyszor fognak mg jra tallkozni).
Vagy ha az gensek morlis meggyzdse ersti az egyttmkdst s az igazsgossgot, megvltoztathatjuk
a jutalommtrixot gy, hogy tkrzze az egyes gensek tbbiekkel val egyttmkdsnek a hasznossgt.
Ksbb ltni fogjuk, hogy az gens olyan megvltoztatsa, hogy a szmtsi kapacitsa korltos, ahelyett hogy
teljesen racionlis kvetkeztetsre lenne kpes, szintn befolysolja a kimenetelt, mivel azt rulhatja el az egyik
gensnek, hogy a msik racionalitsa korltos.
Most nzznk meg egy jtkot, aminek nincs dominns stratgija. Az Acme nev videojtk-hardver
gyrtjnak dntenie kell, hogy a kvetkez jtkgp DVD-ket vagy CD-ket hasznljon. Ekzben a videojtkszoftver gyrtjnak, Bestnek is dntenie kell, hogy DVD-n vagy CD-n adja ki a kvetkez jtkt. A nyeresg
6
557
Created by XMLmind XSL-FO Converter.
Fontos
Erre a jtkra nincs dominns stratgiai egyensly, de ltezik kt Nash-egyensly: (dvd, dvd) s (cd,
cd). Tudjuk, hogy ezek Nash-egyenslyok, mivel akrmelyik jtkos is vlt egyoldalan egy klnbz
stratgira, az rosszabbul fog llni. Most az genseknek a problmja a kvetkez: tbb elfogadhat
megolds is ltezik, de ha az egyes gensek klnbz megoldst vlasztanak, akkor a kiadd
stratgiaprofil egyltaln nem lesz megolds, s mindkt gens vesztesget fog elszenvedni. Hogyan
egyezhetnek meg egy megoldsban? Egy vlasz erre, hogy mindkettnek a Pareto-optimlis megoldst
kell vlasztania (dvd, dvd); azaz leszkthetjk a megolds defincijt az egyrtelm Paretooptimlis Nash-egyenslyokra, feltve, hogy ltezik ilyen. Minden jtknak van legalbb egy Paretooptimlis megoldsa, de egy jtknak lehet tbb egyenslyi pontja, de lehet, hogy ezek nem egyenslyi
pontok. Pldul bellthatjuk a jutalmakat a (dvd, dvd)-nl 5-re 9 helyett. Ebben az esetben kt egyenl
Pareto-optimlis egyenslyi pont ltezik. A kzttk val vlasztshoz az gensek vagy tallgatnak,
vagy kommuniklnak, ami vagy egy megllapods kimondst jelenti, ami sorrendezi a megoldsokat a
jtk megkezddse eltt, vagy trgyalst jelent, hogy egy klcsnsen elnys megolds alakuljon ki
a jtk folyamn (ami egy tbblpses jtk rszeknt megjelen kommunikcis cselekvsek ltt
jelenten). A kommunikci gy pontosan ugyanazokbl az okokbl jelenik meg, mint a tbbgenses
tervezsnl a 12. fejezetben. Az ilyen jtkokat, ahol a jtkosoknak szksges kommuniklniuk,
koordincis jtkoknak (coordination games) nevezzk.
Lttuk, hogy egy jtknak lehet tbb mint egy Nash-egyenslya: honnan tudjuk, hogy minden jtknak van
legalbb egy? Az lehetsges, hogy egy jtknak nincs tiszta stratgij Nash-egyenslya. Gondoljunk t pldul
egy tetszleges tiszta stratgij profilt a ktujjas snblijtkhoz (6. szakasz - Tbbgenses dntsek: a
jtkelmlet rsz). Ha az ujjak sszrtke pros, akkor O szeretne vltani; ha pratlan, akkor pedig E szeretne
vltani. gy egy tiszta stratgij profil nem lehet egyenslyi, s kevert stratgikat kell megnznnk.
De melyik kevert stratgit? 1928-ban Neumann kifejlesztett egy mdszert az optimlis kevert stratgia
megkeressre ktszemlyes zrussszeg jtkokra. A zrussszeg jtk7 (zero-sum game) olyan jtk,
amiben a jutalmak a jutalommtrix elemeiben nullra sszegzdnek. Vilgos, hogy a snblijtk ilyen jtk. A
ktszemlyes zrussszeg jtkoknl tudjuk, hogy a jutalmak egyenlk s ellenttesek, gy csak az egyik
jtkos jutalmait kell figyelembe vennnk, aki a maximl lesz (ahogy a 6. fejezetben is). A snblijtknl az E
pros jtkost vlasztjuk maximlnak, gy a jutalommtrixot az UE(e, o) rtkekkel definilhatjuk a jutalom
E-nek, ha E e-t hajt vgre s O o-t.
Neumann mdszert maximin techniknak nevezik, s a kvetkez mdon mkdik:
Tegyk fel, hogy gy vltoztatjuk meg a szablyokat, hogy elsknt E-nek ktelez felfedni a stratgijt,
majd O kvetkezik. gy egy fordulkon alapul jtkot kapunk, amire a standard minimax algoritmust
alkalmazhatjuk a 6. fejezetbl. Tegyk fel, hogy ez egy UE,O kimenetelt ad. Nyilvnval, hogy ez a jtk Onak kedvez, gy a jtk igazi hasznossga (E szempontjbl) legalbb UE,O. Pldul ha csak tiszta stratgikat
nznk, a minimax jtkfnak a gykrbeli rtke 3 (lsd 17.11. (a) bra), gy tudjuk, hogy U 3.
Most tegyk fel, hogy a szablyokat gy vltoztatjuk meg, hogy elsknt O-nak ktelez felfednie a
stratgijt, majd E kvetkezik. Ennek a jtknak a minimax rtke UE,O, s mivel ez a jtk E-nek kedvez,
tudjuk, hogy U legfeljebb UE,O. Tiszta stratgiknl az rtk +2 (lsd 17.11. (b) bra), gy tudjuk, hogy U
+2.
ltalnosabb az lland sszeg jtkok (constant-sum games) fogalma, amelyekben a jtkbeli minden elemnl az sszeg egy c
llandt ad. Egy n szemlyes lland sszeg jtk egy zrussszeg jtkk konvertlhat c/n kivonsval minden jutalombl. gy a sakk,
a tradicionlis jutalmakkal, mint 1 a gyzelemrt, a dntetlenrt s 0 a vesztesgrt, technikailag egy lland sszeg jtk c = 1-gyel, de
knnyen egy zrus- sszeg jtkk konvertlhat, ha minden jutalombl kivonunk -et.
7
558
Created by XMLmind XSL-FO Converter.
Ezt a kt rvelst sszekapcsolva lthatjuk, hogy a megolds valdi hasznossga (U) eleget fog tenni annak,
hogy
UE,O U UO,E
Fontos
Az U rtknek pontos megllaptshoz az elemzsnkben t kell trni a kevert stratgikra. Elsknt
vegyk szre a kvetkezt: ha az els jtkos felfedte a stratgijt, a msodik nem veszthet azzal,
hogy tiszta stratgit kvet. Az ok egyszer: ha a msodik jtkos egy [p: egy; (1 p): kett] kevert
stratgit jtszik, akkor a vrhat hasznossga a tiszta stratgik hasznossgainak, uegy-nek s ukett-nek
egy lineris kombincija, (p uegy + (1 p) ukett). Ez a lineris kombinci nem haladhatja meg az uegy
s az ukett kzl a nagyobbat, gy a msodik jtkos is jtszhat egy tiszta stratgit.
Ezt az szrevtelt emlkezetnkben tartva, a minimax fknl kpzelhetjk azt, hogy a gykrnl vgtelen sok g
van, amelyek az els jtkos ltal vlaszthat vgtelen sok kevert stratgihoz tartoznak. Ezek mindegyike egy
ketts elgazs csomponthoz vezet, amelyek a msodik jtkos tiszta stratgiihoz tartoznak. Ezeket a
vgtelen fkat gy brzoljuk vges mdon, hogy a gykrnl egy parametrizlt vlaszts van:
Ha E lp elszr, a helyzet a 17.11. (c) brn lthat. E a gykrnl [p: egy; (1 p): kett] szerint jtszik, s O
p rtke alapjn vlaszt egy lpst. Ha O egy-et vlaszt, a vrhat jutalom (E-nek) 2p 3(1 p) = 5p 3; ha
O kett-t vlaszt, a vrhat jutalom 3p + 4(1 p) = 4 7p. Ezeket a jutalmakat mint egyeneseket
tntethetjk fel a grafikonon, ahol p 0 s 1 kztt lehet az x tengelyen, ahogyan az a 17.11. (e) brn lthat.
O, a minimalizl, mindig az alst fogja vlasztani a kt egyenes kzl, amit az brn a vastag egyenes jelez.
gy a legjobb, amit E tehet a gykrnl, hogy p-t a metszspontnl vlasztja meg, aminek rtke:
5p 3 = 4 7p p = 7/12
Fontos
A snblijtkra vonatkoz eredmnynk Neumann ltalnos eredmnynek egy pldja: minden
ktszemlyes, zrussszeg jtknak van egy maximin egyenslya, amikor kevert stratgik
lehetsgesek. Tovbb, egy zrussszeg jtkban minden Nash-egyensly mindkt jtkos szmra
egy maximin. A maximin egyensly megtallsnak ltalnos algoritmusa zrussszeg jtkokban
kiss bonyolultabb, mint amit a 17.11. (e) s 17.11. (f) bra sugallhatna. Ha n cselekvs lehetsges,
akkor egy kevert stratgia egy pont az n dimenzis trben, s az egyenesek hiperskok lesznek. Az is
lehetsges, hogy a msodik jtkos szmra bizonyos tiszta stratgik msokkal dominltak, gy ezek
nem optimlisak az els jtkos egyetlen stratgija ellen sem. Az sszes ilyen stratgia eltvoltsa
utn (amit lehet, hogy ismtlden kell elvgezni), az optimlis vlaszts a gykrnl a legmagasabb
(vagy a legalacsonyabb) metszspontja a megmaradt hiperskoknak. Ennek a vlasztsnak a
megtallsa lineris programozsi feladat (linear programming): egy clfggvny maximlsa
lineris knyszerek mellett. Ilyen problmk szabvnyos technikkkal megoldhatk polinomilis
Az egy egybeess, hogy ezek az egyenletek ugyanazok, mint a p-re vonatkozk; az egybeess amiatt lp fel, mert UE(egy, kett) = UE(kett,
egy) = 3. Ez azt is megmagyarzza, hogy az optimlis stratgia mirt ugyanaz mindkt jtkosnl.
8
559
Created by XMLmind XSL-FO Converter.
560
Created by XMLmind XSL-FO Converter.
A megoldsok (azaz Nash-egyenslyok) megtallsa nem zr sszeg vges jtkokra kiss bonyolultabb. Az
ltalnos megkzelts ktlpses: (1) Soroljuk fel a cselekvsek sszes lehetsges rszhalmazt, amelyek kevert
stratgikat alkothatnak. Pldul elsknt prblkozzunk az sszes olyan stratgiaprofillal, amelyekben
mindegyik jtkos egyetlen cselekvst hasznl, aztn azokkal, amelyekben mindegyik jtkos egy vagy kt
cselekvst hasznl s gy tovbb. Ez a cselekvsek szmban exponencilis, s gy csak viszonylag kis
jtkoknl alkalmazhat. (2) Minden (1)-ben felsorolt stratgiaprofilnl ellenrizzk, hogy az egyenslyi-e. Ez
olyan egyenletek s egyenltlensgek egy rendszernek a megoldsval rhet el, amelyek hasonlk a
zrussszeg jtkban hasznltakhoz. Kt jtkosra ezek az egyenletek linerisak, s alapvet lineris
programozsi technikkkal megoldhatk, de hrom vagy tbb jtkosnl mr nem-linerisak, s esetleg nagyon
nehezen oldhatk meg.
Eddig csak egylpses jtkokat vizsgltunk. A legegyszerbb tbblpses jtk az ismtld jtk (repeated
game), amelyben a jtkosok jra s jra ugyanazzal a vlasztssal szembeslnek, de az egyes alkalmakkor mr
ismert az sszes jtkos korbbi vlasztsainak a trtnete. Az ismtld jtknl egy stratgiaprofil egy
561
Created by XMLmind XSL-FO Converter.
cselekvsvlasztst ad meg mindegyik jtkos szmra, minden idpontban s a korbbi vlasztsok minden
lehetsges trtnetre. Ahogyan az MDF-eknl, a jutalmak az idben additvak.
Gondoljuk t a fogolydilemma ismtld vltozatt. Egytt fog-e mkdni Aliz s Bendegz, visszautastva a
tanskodst, azt tudva, hogy jra fognak tallkozni? A vlasz a tallkozs rszleteitl fgg. Tegyk fel, hogy
Aliz s Bendegz tudja, hogy pontosan 100 menetben jtszanak fogolydilemmsat. Ekkor mindketten tudjk,
hogy a 100. menet nem lesz ismtelt jtk azaz, a kimenetelnek nincs hatsa jvbeli menetekre , s ezrt
ebben a menetben mindketten a dominns stratgit, a tanskods-t vlasztjk. De a 100. menet
meghatrozsval a 99. menetnek nem lehet hatsa kvetkez menetekre, gy ennek szintn lesz egy dominns
stratgiai egyenslya a (tanskodik, tanskodik)-nl. Indukcival mindkt jtkos a tanskodst fogja vlasztani
minden menetben, fejenknt sszesen 500 v brtnt kapva. Eltr megoldsokat nyerhetnk az interakci
szablyainak a megvltoztatsval. Tegyk fel, hogy minden menet utn 99% eslye van, hogy a jtkosok jra
tallkoznak.
Ekkor a menetek vrhat szma mg mindig 100, de egyik jtkos sem tudja biztosan, hogy melyik menet lesz
az utols. Ezen felttelek mellett egyttmkdbb viselkeds lehetsges. Pldul a tagads mindegyik
jtkosnak egyenslyi stratgia mindaddig, amg a msik jtkos nem vlaszt tanskods-t. Ezt a stratgit
rks bntetsnek (perpetual punishment) nevezik. Tegyk fel, hogy mindkt jtkos ezt a stratgit
fogadta el, s ez klcsnsen ismert. Ekkor mindaddig, amg egyik jtkos sem vlasztotta a tanskods-t,
brmely idpontban a vrhat jvbeli teljes jutalom mindegyik jtkosnak
Az a jtkos, aki a tanskods-t vlasztja, egy 0 pontszmot nyer 1 helyett a soron kvetkez lpsben, de a
teljes vrhat jvbeli jutalma a kvetkezre vltozik:
Ezrt egyik lpsnl sincs indtk eltrni a (tagad, tagad)-tl. Az rks bntets a fogolydilemma egy
klcsnsen biztostott megsemmistsi stratgija: alighogy az egyik jtkos a tanskods mellett dnt, ez
biztostja, hogy mindkt jtkos nagy vesztesget fog elszenvedni. De ez csak akkor elrettent, ha a msik
jtkos elhiszi, hogy ezt a stratgit fogadtuk el vagy legalbbis hogy elfogadhattuk.
Vannak ms stratgik, amelyek megbocstbbak. A leghresebb a szemet szemrt (tit-for-tat), ami szerint
tagads-sal kell kezdeni, majd megismtelni a msik jtkos elz lpst az sszes elkvetkez lpsben. gy
Aliz tagadna, ameddig Bendegz tagadna, s a Bendegz tanskodsa utni lpsben is tanskodna, de
visszatrne a tagadshoz, ha Bendegz visszatrt. Br nagyon egyszer, ez a stratgia igen robusztusnak s
hatkonynak bizonyult stratgik szles kre ellen.
Klnbz megoldsokat az gensek megvltoztatsval is kaphatunk, a tallkozs szablyainak vltoztatsa
helyett. Tegyk fel, hogy az gensek vges llapot gpek n llapottal, s egy m > n lpses jtkot jtszanak.
Az gensek gy nem kpesek reprezentlni a htramarad lpsek szmt, gy azt ismeretlenknt kell kezelni.
gy k nem kpesek az indukcis levezetsre, s lehetsgk van a kedvezbb (tagad, tagad) esetet elrni.
Ebben az esetben a tudatlansg lds vagy inkbb az, hogy elhitessk az ellenfllel, hogy tudatlanok vagyunk.
Ezekben az ismtld jtkokban a sikernk a msik jtkos benyomsn mlik, hogy nyomulsok vagy
mamlaszok vagyunk, s nem a valdi tulajdonsgunkon.
Az ismtld jtkok teljesen ltalnos trgyalsa meghaladja a knyv kereteit, de szmos helyzetben
megjelennek. Pldul konstrulhatunk egy szekvencilis jtkot, ha a 17.1. bra 4 3-as vilgba kt genst
behelyeznk. Ha kiktjk, hogy nem kvetkezik be mozgs, amikor a kt gens ugyanarra a mezre prbl lpni
(ugyanaz a problma szmos forgalmi tkeresztezdsben), akkor bizonyos tiszta stratgik rkre
beragadhatnak. Megolds, ha mindegyik gens vletlenszeren vlaszt az elrefel lps s a helyben marads
kztt; a holtpont gyorsan felolddik, s mindkt gens boldog lesz. Pontosan ezt teszik az Ethernethlzatokban a csomagtkzs feloldsra.
Az ismtld jtkok jelenleg ismert megoldsi mdszerei a 6. fejezetbl ismert tbbforduls jtkok megoldsi
mdszereihez hasonltanak abban, hogy egy jtkfa pthet a gykrtl lefel, s megoldhat a levelektl
felfel. A f klnbsg az, hogy egy gyerekcsompont rtkei feletti egyszer maximum- vagy minimumkpzs
562
Created by XMLmind XSL-FO Converter.
helyett az algoritmusnak minden szinten meg kell oldania egy kevert stratgij jtkot, felttelezve, hogy a
gyerekcsompontok mr megoldottak, s jl definilt rtkk felhasznlhat.
Az ismtld jtkokat rszlegesen megfigyelhet krnyezetekben rszleges informcij (partial
information) jtkoknak nevezik. A pldk kztt tallhatunk olyan krtyajtkokat, mint a pker s a bridzs,
amelyekben mindegyik jtkos a krtyknak csak egy rszt lthatja, de olyan komolyabb jtkokat is, mint a
nukleris hbors modellek, ahol egyik fl sem ismeri az ellenfl sszes fegyvernek a helyzett. Rszleges
informcij jtkokat a hiedelmi llapotok fjnak a vizsglatval oldanak meg gy, mint az RMMDF-ekben
(lsd 17.4. alfejezet). Fontos klnbsg az, hogy mg a sajt hiedelmi llapotok megfigyelhetk, addig az
ellenfl hiedelmi llapotai nem. Ilyen jtkokra csak mostanban fejlesztettek ki a gyakorlatban hasznlhat
algoritmusokat. Megoldsok szlettek a pker bizonyos egyszerbb vltozataira, bebizonytva, hogy a blffls
valban racionlis vlaszts egy jl kiegyenslyozott kevert stratgia rszeknt. Az ilyen tanulmnyokbl
alakult ki az a lnyeges meglts, hogy a kevert stratgik nemcsak azrt hasznosak, mert valakinek a
cselekvst megjsolhatatlann teszik, hanem azrt is, mert minimalizljk annak az informcinak a
mennyisgt, amit az ellenfl a cselekvsek megfigyelsvel tanulni kpes. rdekes, hogy annak ellenre, hogy
a bridzs jtszshoz val programok tervezi nagyon is tisztban vannak az informci gyjtsnek s
elrejtsnek a fontossgval, senki sem javasolta vletlenszer stratgik hasznlatt.
A jtkelmlet felhasznlsnak az genstervezs szlesebb terletn eddig szmos akadlya volt. Elsknt
vegyk szre, hogy egy Nash-egyenslyban egy jtkos teljes mrtkben felttelezi azt, hogy az ellenfl
egyenslyi stratgit jtszik. Ez azt jelenti, hogy a jtkos semmilyen elvrst sem kpes felhasznlni a tbbi
jtkos valszn cselekvsvel kapcsolatban, s gy lehet, hogy olyan fenyegetsek ellen val vdekezsre
vesztegeti el az rtkeit, amelyek soha nem is lpnek fel. A BayesNash-egyensly (BayesNash equilibrium)
fogalma rszben ezt a hinyossgot ptolja: ez egy olyan egyensly, ami megfelel egy jtkos a priori
valsznsg-eloszlsnak a tbbi jtkos stratgii felett mskppen fogalmazva, kifejezi egy jtkos
elvrsait a tbbi jtkos valszn stratgijrl. Msodszor, jelenleg nincs j mdszer a jtkelmleti s az
RMMDF irnytsi stratgik sszekapcsolsra. Ezek s ms problmk miatt a jtkelmletet elsdlegesen
inkbb olyan krnyezetek elemzsre hasznljk, amelyek egyenslyban vannak, a krnyezetben lv gensek
irnytsa helyett. Hamarosan ltni fogjuk, hogy a jtkelmlet hogyan segtheti a krnyezetek tervezst.
7. Mkdsi md tervezs
Az elz alfejezetben azt a krdst prbltuk megvlaszolni, hogy Ha adott egy jtk, mi a racionlis
stratgia? Ebben az alfejezetben azt krdezzk, hogy Ha az gensek racionlisak, milyen jtkot tervezznk?
Pontosabban, egy olyan jtkot szeretnnk tervezni, aminek a megoldsa az egyes gensek ltal kvetett sajt
racionlis stratgiik egyttese, s ez egy globlis hasznossgfggvny maximlst eredmnyezi. Ezt a
problmt mkdsi md tervezsnek (mechanism design) nevezik, vagy nha inverz jtkelmletnek
(inverse game theory). A mkdsi md tervezs a kzgazdasg-tudomnyok s a politikai tudomnyok a
lnyege. gensek egyttesnl ez annak lehetsgt hordozza magban, hogy jtkelmleti mkdsi mdokat
hasznlva gyes rendszereket hozunk ltre korltoltabb rendszerek egyttesbl mg nem egyttmkd
rendszerekbl is , nagyon hasonlan ahhoz, ahogy emberek csoportjai olyan clokat tudnak elrni, amik
messze tl vannak az egyni lehetsgeken.
A mkdsi md tervezs pldi kztt olcs repljegyek elrverezse, TCP-csomagok szmtgpek kztti
tovbbtshoz megfelel tvonal keresse, szigorl orvosok krhzakhoz rendelse, illetve annak eldntse
szerepel, hogy robotfocistk hogyan mkdjenek egytt a csapattrsaikkal. A mkdsi md tervezs az 1990es vektl lpett ki az egyetemek falai kzl, amikor szmos orszg, a msorszr frekvenciasvok
elrverezsnek a problmjval szembeslve, dollrszzmillikat vesztett a lehetsges bevteleibl a gyenge
mkdsi md tervezs eredmnyekppen. Formlisan a mkdsi md (mechanism) tartalmaz (1) egy
nyelvet az gensek ltal vlaszthat megengedett stratgik (potencilisan vgtelen) halmaznak a lersra s
(2) egy G kimeneteli szablyt, ami a jutalmakat hatrozza meg az genseknek megengedett stratgik egy adott
stratgiaprofilja esetn.
Els rnzsre a mkdsi md tervezs problmja trivilisnak tnik. Tegyk fel, hogy az U globlis
hasznossgfggvny dekomponldik egyni Ui gens hasznossgfggvnyek valamely halmazra gy, hogy U
= iUi. Ekkor mondhatnnk azt, hogy ha mindegyik gens maximlja a sajt hasznossgt, ez biztosan a globlis
hasznossg automatikusan maximlshoz fog vezetni. (Pldul a kapitalizmus egyszeregye szerint, ha egy
trsadalomban mindenki megprbl gazdagodni, a trsadalom sszgazdagsga nvekedni fog.) Sajnos ez nem
mkdik. Az egyes gensek cselekvsei befolysolhatjk a tbbi gens jltt oly mdon, hogy a globlis
hasznossg cskken. Erre plda a kzlegel tragdija (tragedy of commons), amely helyzetben az egyni
563
Created by XMLmind XSL-FO Converter.
gazdlkodk az sszes lbasjszgukat ingyen legeltetik a vros kzlegeljn, ezrt a kzlegel tnkremegy, s
az sszes gazdlkod nagy vesztesget szenved el. Mindegyik gazdlkod egynileg racionlisan cselekedett,
azzal rvelve, hogy a kzlegel ingyenes, s azzal, hogy br a kzlegel hasznlata a tnkremenetelhez vezet, a
hasznlatnak a mellzse ezt nem befolysolja (hiszen msok gyis hasznlnk). Hasonl rvelsek
alkalmazhatk a szennyez anyagok kibocstsa esetn a lgkr s az cenok hasznlatra is.
Az ilyen problmk szabvnyos megkzeltse a mkdsi md tervezsben az, hogy a kztulajdon
hasznlatrt mindegyik gensnl kltsget szmtunk fel. ltalnosabban, azt kell biztostanunk, hogy minden
klssg (externalities) olyan globlis hasznossgot befolysol tnyez, amely az egyni gensek
tranzakciiban nincsenek elismerve klnllan nevestve megjelenjen. Ebben a nehz a helyes rak
megllaptsa. Ennek a megkzeltsnek a vgletes formja egy olyan mkdsi md megalkotst jelenti,
amelyben mindegyik genstl valjban a globlis hasznossg maximlst kveteljk meg. Ez
megoldhatatlanul nehz feladat az gens szmra, aki sem megbecslni nem tudja a vilg jelenlegi llapott,
sem megfigyelni a cselekvseinek az sszes tbbi gensre gyakorolt hatst. A mkdsi md tervezs ezrt
olyan mkdsmdok megtallsra sszpontost, amelyeknl az egyes gensek dntsi problmja knnyen
megoldhat.
Gondoljuk t elszr az rverseket. Az rvers a legltalnosabb formjban egy mkdsmd bizonyos
ruknak egy ajnlattev csoport tagjai szmra trtn eladsra. Az rajnlatok, a stratgik s a kimenetel
meghatrozza, hogy ki kapja az rukat s mennyit fizet. A mestersges intelligenciban pldul az rversek
akkor jelennek meg, amikor gensek egy csoportja eldnti, hogy egyttmkdjenek-e egy kzs terven.
Hunsberger s Grosz megmutatta, hogy ez hatkonyan elrhet rverssel, amiben az gensek ajnlatokat
tesznek a kzs tervbeli szerepkre (Hunsberger s Grosz, 2000). Egyelre olyan rverseket tekintnk t,
amelyekben (1) egyetlen ru van, (2) mindegyik ajnlattevnek van egy vi hasznossgrtke az rura, s (3) ezek
az rtkek csak az ajnlattev szmra ismertek. Az ajnlattevk megteszik a bi ajnlataikat, s a legmagasabb
ajnlat nyeri el az rukat, de a mkdsmd hatrozza meg, hogyan tehetk meg az ajnlatok, s mi a gyztes
ltal fizetend r (ami nem szksgszeren bi). Az rversek legismertebb tpusa az angol rvers (English
auction), amelyben az rverez mindaddig nveli az ruk rt, amg csak egyetlen ajnlattev marad,
ellenrizve kzben, hogy vajon az ajnlattevk rdekeltek-e mg. Ennek a mkdsmdnak az a tulajdonsga,
hogy a legnagyobb vi rtkkel br ajnlattev nyeri el az rukat bm + d ron, ahol bm a legmagasabb ajnlat az
sszes tbbi jtkos kztt, s d az rverez nvekmnye az ajnlatok kztt.9 Az angol rversnl az
ajnlattevknek egyszer dominns stratgijuk van: addig tegynk rajnlatokat, ameddig a jelenlegi kltsg a
szemlyes rtk alatt van. Emlkezznk arra, hogy a dominns azt jelenti, hogy a stratgia minden ms
stratgia ellen mkdik. Ez viszont azt jelenti, hogy egy jtkos a tbbi stratgitl fggetlenl vlaszthatja ezt.
Ezrt a jtkosoknak nem kell idt s energit vesztegetnik a tbbi jtkos stratgijn val elmlkedssel. Egy
mkdsmdot stratgiamentesnek (strategy-proof) neveznk, ha a jtkosoknak van dominns stratgija,
ami magban foglalja a valdi indtkok felfedst is.
Az angol rvers htrnyos tulajdonsga a nagy kommunikcis kltsg, gy vagy egy szobban kell az
rversnek lezajlania, vagy az sszes ajnlattevnek nagysebessg, biztonsgos kommunikcis csatornval
kell rendelkeznie. Egy kevesebb kommunikcit ignyl alternatv mkdsmd a zrt ajnlat rvers
(sealed bid auction). Ebben minden ajnlattev egyetlen ajnlatot tesz, s ezt kzli az rverezvel, s a
legnagyobb ajnlat gyz. Ennek a mkdsmdnak az esetben az a stratgia, aminek az rajnlata a valdi
rtk, mr nem dominns. Ha valakinek az rtke vi, s az elvrsa szerint az sszes tbbi jtkos maximlis
ajnlata bm lesz, akkor az rajnlatnak a vi s bm + kzl az alacsonyabbnak kell lennie. A zrt ajnlat rvers
kt htrnya, hogy elfordulhat, hogy a legnagyobb vi rtkkel br jtkos nem kapja meg az rukat, illetve az,
hogy a jtkosoknak fradozniuk kell a tbbi jtkos stratgijn val elmlkedssel.
A zrt ajnlat rvers szablyainak kis vltoztatsval addik a zrt ajnlat msodik ras rvers (sealed
bid second-price auction), ami Vickrey-rvers (Vickrey auction) nven is ismert.10 Az ilyen rverseknl a
gyztes a msodik legmagasabb ajnlati rat fizeti a sajt rajnlatnak a kifizetse helyett. Ez az egyszer
mdosts teljesen kikszbli a szabvnyos (avagy els ras, first-price) zrt ajnlat rversnl szksges
sszetett mrlegelseket, mivel ekkor a dominns stratgia sajt rtk rajnlat. Ennek beltshoz vegyk
szre, hogy brmely jtkos tekintheti az rverst egy ktszemlyes jtknak, figyelmen kvl hagyva az sszes
jtkost, kivve nmagt s a tbbi jtkos kzl a legmagasabb rajnlatot tevt. Az i. jtkos hasznossga a
sajt bi ajnlata, a vi rtke s a tbbi jtkos legjobb bm ajnlata szempontjbl
Valjban van egy kis eslye, hogy a legnagyobb vi rtkkel br jtkosnak nem sikerl megszereznie az rukat abban az esetben, amikor
bm < vi < bm + d. Annak az eslyt, hogy ez megtrtnjen, tetszlegesen kicsiv lehet tenni a d nvekmny cskkentsvel.
10
William Vickreyrl elnevezve, aki az 1996-os kzgazdasgi Nobel-dj kitntetettje.
9
564
Created by XMLmind XSL-FO Converter.
Annak beltshoz, hogy a bi = vi dominns stratgia, vegyk szre, hogy amikor (vi bm) pozitv, akkor
brmelyik ajnlat optimlis, ami megnyeri az rverst, s vi megttele nevezetesen megnyeri az rverst.
Msrszt, amikor (vi bm) negatv, akkor brmelyik ajnlat optimlis, ami elveszti az rverst, s vi megttele
nevezetesen elveszti az rverst. gy a vi rajnlat optimlis az sszes lehetsges bm rtkre, s valjban ez csak
a vi rajnlatra teljesl. Az egyszersge miatt, tovbb mind az rverez, mind az ajnlattev szmra
jelentkez minimlis szmtsi ignye miatt a Vickrey-rverst szles krben hasznljk elosztott MI-rendszerek
ltrehozsban.
Most gondoljuk t az internet forgalomirnytsi problmjt. A jtkosok a kapcsoldsi hl grfjban az
lekhez tartoznak. Minden jtkos ismeri egy zenet kldsnek a kltsgt a sajt ln t; ha nincs kldend
zenet, akkor a kltsg 0. A cl az, hogy egy zenet szmra megtalljuk a legolcsbb utat a kiindulstl a clig,
ahol a teljes t kltsge az egyes lek kltsgnek az sszege. A 4. fejezet szmos algoritmust ad az lkltsgek
ismeretben a legrvidebb t kiszmtsra, gy minden, amit tennnk kell, az, hogy az egyes genseket
rvegyk, hogy jelentsk a valdi ci kltsgket. Sajnos, ha csupn megkrdezzk az genseket, akkor magas
kltsget fog jelenteni, hogy arra btortson, kldjk t az zenetet mshol. Ki kell fejlesztennk egy
stratgiamentes mkdsi mdot. Egy ilyen mkdsi md, ha minden jtkosnak fizetnk egy pi jutalmat, ami a
legrvidebb, az i-edik let nem tartalmaz t hossza mnusz a legrvidebb t (keressi algoritmus ltal
kiszmolt) hossza, ahol az i-edik l kltsgt 0-nak ttelezzk fel.
pi = Hossz(t ci = -nl) Hossz(t ci = 0-nl)
Megmutathat, hogy e mellett a mkdsi md mellett a dominns stratgia mindegyik jtkosnak a ci szinte
jelentse, illetve, hogy ennek megttele a legolcsbb utat fogja eredmnyezni. E kvnatos tulajdonsg ellenre
az itt vzolt mkdsmdot a gyakorlatban nem hasznljk a nagy kommunikcis s kzponti szmtsi
kltsg miatt. A mkdsi md terveznek kommuniklnia kell az sszes n jtkossal, s aztn egy
optimalizcis problmt kell megoldania. Ez megrheti, ha a kltsgek eloszlannak sok zenet felett, de vals
hlzatokban a ci kltsgek folyamatosan vltoznnak a forgalom torldsa, a gpek zemkptelenn vlsa s
belpse miatt. Eddig teljesen kielgt megoldst mg nem fejlesztettek ki.
8. sszefoglals
A fejezet megmutatta, hogyan hasznljuk a vilgrl meglv tudsunkat dntsek meghozatalra, mg akkor is,
amikor egy cselekvs kimenetelei bizonytalanok, s a cselekvsrt jr jutalmat nem arathatjuk le csak tbb
cselekvs utn. A legfbb pontok:
A szekvencilis dntsi problmkat bizonytalan krnyezet esetn, ms nven Markov dntsi folyamatokat
vagy MDF-ket (Markov decision process, MDP), teljesen definilja egy cselekvsek valsznsgi
kimenetelt meghatroz llapottmenet-modell (transition model) s az egyes llapotokbeli jutalmakat
meghatroz jutalomfggvny (reward function).
Egy llapotsorozat hasznossga a sorozathoz tartoz sszes jutalom sszege, ami lehet az idvel leszmtolt.
Egy MDF megoldsa egy eljrs (policy), ami mindegyik gens ltal elrhet llapothoz hozzrendel egy
dntst. Egy optimlis eljrs maximlja a vgrehajtsa sorn fellp llapotsorozatok hasznossgt.
Egy llapot hasznossga az azon llapotsorozatok vrhat hasznossga, amelyek ebbl az llapotbl
kezddnek, s egy optimlis eljrs vgrehajtsa esetn lpnek fel. Az MDF-k megoldsra szolgl
rtkiterci (value iteration) algoritmusa a mkdse sorn az egyenleteket iteratvan oldja meg, az egyes
llapotok hasznossgait a szomszdai hasznossghoz kapcsolva.
Az eljrsmd-iterci (policy iteration) felvltva kiszmolja az llapotoknak az aktulis eljrshoz tartoz
hasznossgt, majd az aktulis hasznossgokhoz kpest javt az aktulis eljrson.
A rszlegesen megfigyelhet MDF-ek vagy RMMDF-ek sokkal nehezebben oldhatk meg, mint az MDF-ek.
Megoldsuk sorn konvertljuk ket egy olyan MDF-be, amit hiedelmi llapotok folytonos terben
definilunk. Az optimlis viselkeds az RMMDF-ekben magban foglalja az informcigyjtst a
bizonytalansg cskkentse cljbl, s gy a jvbeli jobb dntsek meghozatala miatt is.
565
Created by XMLmind XSL-FO Converter.
Az RMMDF-krnyezetekre egy dntselmleti gens hozhat ltre. Az gens egy dinamikus dntsi hlt
(dynamic decision network) hasznl az llapottmenet-modell s megfigyelsi modell brzolsra, a
hiedelmi llapotnak frisstsre, illetve lehetsges cselekvsi sorozatok elre elgondolshoz.
A jtkelmlet (game theory) olyan szitucikban rja le az gensek racionlis viselkedst, amelyekben
tbb gens egyidej interakcija van jelen. A jtkok megoldsai Nash-egyenslyok olyan stratgiaprofilok,
amelyekben egyik gensnek sincs indtka a megadott stratgitl eltrni.
A mkdsi md tervezs (mechanism design) hasznlhat fel az gensek interakcijt megad olyan
szablyok megllaptsra, amelyek egy globlis hasznossgot az egyni racionlis gensek tevkenysgn
keresztl maximlnak. Nha lteznek olyan mkdsmdok, amelyek ezt a clt gy rik el, hogy az egyes
genseknek nem kell meggondolniuk a tbbi gens ltal hozott dntseket.
Az MDF-ek s az RMMDF-ek vilgra vissza fogunk trni a 21. fejezetben, amikor a megerstses tanuls
mdszert tanulmnyozzuk, ami lehetv teszi az gens szmra, hogy a tapasztalatai alapjn javtsa a
viselkedst szekvencilis, bizonytalan krnyezetekben.
566
Created by XMLmind XSL-FO Converter.
8.2. Feladatok
17.1.
567
Created by XMLmind XSL-FO Converter.
A 17.1. bra ltal mutatott 4 3-as vilg esetn szmtsa ki mely ngyzetek s milyen valsznsggel rhetk
el az [1, 1]-bl a [Fel, Fel, Jobbra, Jobbra, Jobbra] cselekvssorozattal. Magyarzza el, hogyan kapcsoldik ez
a szmts egy rejtett Markov-modell elre elgondolshoz (projecting).
17.2.
Tegyk fel, hogy egy llapotsorozat hasznossgt a sorozat llapotaiban kapott jutalmak maximumaknt
definiljuk. Mutassuk meg, hogy ez a hasznossgfggvny nem eredmnyez stacionrius preferencikat az
llapotszekvencik kztt. Lehetsges-e mgis olyan hasznossgfggvnyt definilni az llapotokon, hogy a
MVH-dntshozatal optimlis viselkedst adjon?
17.3.
Pontosan konvertlhat-e egy vges keressi problma Markov dntsi problmv gy, hogy az utbbi
optimlis megoldsa az elznek is optimlis megoldsa legyen? Ha igen, magyarzza el pontosan, hogyan
konvertlja a problmt, s hogyan konvertlja a megoldst visszafel; ha nem, akkor magyarzza el, hogy mirt
nem (azaz adjon ellenpldt).
17.4.
Kpzeljnk el egy leszmtolatlan MDF-et hrom llapottal, (1, 2, 3) s sorrendben a kvetkez jutalmakkal 1,
2, 0. A 3-as llapot egy vgllapot. Az 1-es s 2-es llapotokban kt lehetsges cselekvs van: a s b. Az
llapottmenet-modell a kvetkez:
Az 1-es llapotban az a cselekvs az genst a 2-es llapotba mozgatja 0,8 valsznsggel, mg 0,2
valsznsggel helyben hagyja.
Az 2-es llapotban az a cselekvs az genst az 1-es llapotba mozgatja 0,8 valsznsggel, s 0,2
valsznsggel helyben hagyja.
Mind az 1-es, mind a 2-es llapotban a b cselekvs az genst a 3-as llapotba mozgatja 0,1 valsznsggel,
s 0,9 valsznsggel helyben hagyja.
Vlaszolja meg a kvetkez krdseket:
a. Mi hatrozhat meg kvalitatvan az optimlis eljrsmdrl az 1-es s a 2-es llapotokban?
b. Alkalmazzon eljrsmd-itercit az optimlis eljrsmd, illetve az 1-es s a 2-es llapotok rtknek a
meghatrozsra. Minden lpst teljesen illusztrljon. Tegyk fel, hogy a kezdeti eljrsmd mindkt
llapotban a b cselekvs.
c. Mi trtnik az eljrsmd-itercival, ha a kezdeti eljrsmd mindkt llapotban az a cselekvs? Segt a
leszmtols? Fgg-e az optimlis eljrsmd a leszmtolsi tnyeztl?
17.5.
Alkalmanknt az MDF-ek megadsa tartalmaz egy R(s, a) jutalomfggvnyt, ami a vghezvitt cselekvstl
fgg, vagy egy R(s, a, s) jutalomfggvnyt, ami mg a kimeneteli llapottl is fgg.
a. rja fel a Bellman-egyenleteket ezt a formalizmust hasznlva.
b. Mutassa meg, hogyan lehet egy R(s, a, s) jutalomfggvnyt tartalmaz MDF-et talaktani egy msik, R(s, a)
jutalomfggvnyt tartalmaz MDF-be gy, hogy az optimlis eljrsmdok az j MDF-ben pontosan
megfeleljenek az eredeti MDF-beli optimlis eljrsmdoknak.
c. Most ugyangy konvertlja az R(s, a)-t tartalmaz MDF-eket R(s)-t tartalmaz MDF-ekbe.
17.6.
Tekintsk a 17.1. brn lthat 4 3-as vilgot.
568
Created by XMLmind XSL-FO Converter.
a. Valstson meg egy olyan krnyezetszimultort erre a krnyezetre, amelyben a krnyezet fldrajzi
sajtossgai knnyen megvltoztathatk. Ehhez egy bizonyos forrskd mr elrhet a knyv
forrskdtrban a vilghln.
b. Hozzon ltre egy eljrsmd-itercit hasznl genst, s mrje meg a teljestmnyt a
krnyezetszimultorban klnbz kiindulsi llapotokbl. Vgezzen nagyszm ksrletet mindegyik
kiindulsi llapotbl, s hasonltsa ssze a futsonknt kapott sszjutalmak tlagt az llapot hasznossgval
(amit a ltrehozott algoritmus hatrozott meg).
c. Ksrletezzen a krnyezet mretnek a megnvelsvel. Hogyan vltozik az eljrsmd-iterci futsi ideje a
krnyezet mretnek a vltozsval?
17.7.
A 17.1. brn mutatott krnyezetre keresse meg az R(s) fggvnyre az sszes kszbrtket, azaz azokat az
rtkeket, amelyek tlpsekor az optimlis eljrsmd megvltozik. Ehhez egy mdszer szksges az optimlis
eljrsmd meghatrozshoz s egy rgztett R(s) esetn az rtknek a kiszmtshoz. (Segtsg: bizonytsa
be, hogy az rtk minden rgztett eljrsmdnl R(s)-sel linerisan vltozik.)
17.8.
Ebben a feladatban ktszerepls MDF-ekkel foglalkozunk, amelyek a zrussszeg, tbbforduls jtkokhoz
tartoznak, mint amilyenek a 6. fejezetben szerepelnek. Legyen a kt jtkos A s B, s legyen R(s) az A jtkos
jutalma az s llapotban. (B jutalma mindig egyenl s ellenttes eljel.)
a. Legyen UA(s) az s llapot hasznossga, amikor A lpse kvetkezik s-ben, s legyen UB(s) az s llapot
hasznossga, amikor B kvetkezik s-ben. Az sszes jutalom s hasznossg A szempontjbl van
megfogalmazva (pontosan gy, ahogyan a minimax jtkfban). rja fel az UA(s)-t s az UB(s)-t definil
Bellman-egyenleteket.
b. Magyarzza el, hogyan vgezhet ktszemlyes rtkitercit ezekkel az egyenletekkel, s adjon meg egy
alkalmas lellsi kritriumot.
c. Tekintsk a 6.14. brn lthat jtkot a 8.2. szakasz - Feladatok rszben. Rajzolja fel az llapotteret (a
jtkfa helyett), folytonos vonallal mutatva A mozgsait s szaggatott vonallal B mozgsait. Jegyezze fel
minden llapothoz az R(s) rtkt. Hasznos lehet az (sA, sB) llapotok elrendezse egy ktdimenzis rcson,
sA-t s sB-t koordintaknt hasznlva.
d. Most alkalmazza a ktszemlyes rtkitercit a jtk megoldsra, s szrmaztassa az optimlis
eljrsmdot.
17.9.
Mutassuk meg, hogy egy dominns stratgiai egyensly egy Nash-egyensly, de ez visszafel nem igaz.
17.10.
A k-papr-oll gyerekjtkban mindegyik jtkos egyszerre felmutatja a vlasztst, ami k, papr vagy oll. A
papr becsomagolja a kvet, a k kicsorbtja az ollt, az oll elvgja a paprt. A kiterjesztett k-papr-oll-tzvz vltozatban a tz ti a kvet, paprt s ollt, a k, papr s oll ti a vizet, s a vz ti a tzet. rja fel a
jutalmazsi mtrixot, s keressen egy kevert stratgij megoldst a jtkhoz.
17.11.
Oldja meg a hromujjas snblijtkot.
17.12.
A Nemzeti Jgkorong Szvetsgben (National Hockey League) 1999 eltt a csapatok 2 pontot kaptak a
gyzelemrt, 1-et a dntetlenrt s 0-t, ha vesztettek. Ez zrussszeg jtk? 1999-ben a szablyokat gy
mdostottk, hogy egy csapat 1 pontot kap, ha hosszabbtsban kap ki. A gyztes csapat tovbbra is 2 pontot
kap. Hogyan vltoztatja meg ez a mdosts a fenti krdsekre a vlaszokat? Ha trvnyes lenne, mikor volna
racionlis a kt csapatnak titokban megegyezni, hogy a rendes jtkidben dntetlent rnek el, s majd a
569
Created by XMLmind XSL-FO Converter.
hosszabbtsban dntik el a kzdelmet? Tegyk fel, hogy mindegyik csapat szmra a kapott pontszmok
jelentik a hasznossgot, s hogy ltezik egy klcsnsen ismert p a priori valsznsg, hogy az els csapat
hosszabbtsban fog nyerni. Milyen p rtkekre rtene egyet mindkt csapat ezzel az egyezsggel?
17.13.
A kvetkez jutalommtrix Blindertl szrmazik, amit Bernstein kzl (Blinder, 1983; Bernstein, 1996), a
politikusok s a jegybank (Federal Reserve) kztti jtkot brzolja.
A politikusok lazthatjk vagy szigorthatjk a pnzgyi politikt, mg a jegybank lazthatja vagy szigorthatja a
monetris politikt. (s termszetesen mindkt oldal vlaszthatja azt, hogy nem tesz semmit.) Mindegyik
oldalnak vannak preferencii, hogy kinek mit kell tennie egyik oldal sem szeretne rossznak ltszani. A
mutatott jutalmak egyszeren sorrendi rangok: 9 az els vlasztsrt s vgl 1 az utolsrt. Keresse meg a jtk
Nash-egyenslyt a tiszta stratgik kztt. Ez Pareto-optimlis megolds? Az olvas esetleg rdemesnek tartja
elemezni a jelenlegi kormny politikjt ennek fnyben.
570
Created by XMLmind XSL-FO Converter.
1. Tanulsi formk
A msodik fejezetben lttuk, hogy a tanul gens felfoghat gy, mint aminek van egy cselekv komponense
(performance element), amellyel eldnti, hogy milyen cselekvst vlasszon, s egy tanul komponense
(learning element), amellyel mdostja ezt a cselekv elemet annak rdekben, hogy a ksbbiekben jobb
dntseket hozzon (lsd 2.15. bra). A gpi tanulssal foglalkoz kutatk a tanul komponensek szles
vlasztkval lltak el. Ezek megrtst segti, ha megnzzk, hogy a leend mkdsi terletk hogyan
befolysolja tervezsket. A tanul komponens tervezst hrom dolog befolysolja alapveten. Ezek:
A cselekv elem mely komponenseit akarjuk tantani.
Milyen visszacsatols ll rendelkezsre ezen komponensek tantsra.
Hogyan reprezentljuk a komponenseket.
Ezeket a szempontokat rendre elemezni fogjuk. Lttuk, hogy szmos lehetsg van a cselekv elemek ptsre,
a 2. fejezetben szmos genskialaktst megismertnk (lsd 2.9., 2.11., 2.13. s 2.14. bra). Ezeknek az
genseknek a komponensei a kvetkezket tartalmazzk:
1. Az aktulis llapot feltteleinek kzvetlen lekpezse cselekvsekre.
2. Olyan lehetsg, amely egy megfigyelsi szekvencibl a vilg relevns tulajdonsgaira kpes kvetkeztetni.
3. A vilg alakulsra vonatkoz, valamint az gens lehetsges cselekvseinek kvetkezmnyeit ler
informci.
4. A vilg lehetsges llapotainak szmunkra kvnatos voltt megad hasznossg- informci.
5. Cselekvs-hasznossg informci, amely az egyes cselekvsek kvnatossgt jelzi szmunkra.
6. Clok: ezek olyan llapotosztlyokat adnak meg, amelyek elrse az gens hasznossgt maximlja.
Megfelel visszacsatols alkalmazsa esetn ezen komponensek mindegyike tanulhat. Vegynk pldul egy
genst, amely taxivezetst tanul. Minden egyes alkalommal, amikor a felgyel elkiltja magt: Fk!, az
gens megtanulhat egy felttel-cselekvs fkezsi szablyt (1. komponens). Amennyiben szmos olyan kpet
mutatunk az gensnek, amelyrl kzljk, hogy busz van rajta, akkor megtanulhatja felismerni azokat (2). Ha
egy cselekvst prblgat, s megfigyeli az eredmnyt pldul nedves ton ersen fkez , megtanulhatja
cselekvseinek hatst (3). Ha nem kap borravalt utastl, akit jl sszerzott az t, akkor rtkes elemekkel
gazdagthatja az ltalnos hasznossg- fggvnyt (4).
Az gens eltt ll tanulsi folyamat meghatrozsban rendszerint a visszacsatols jellege a legfontosabb
faktor. A gpi tanuls terletn ltalban hrom esetet klnbztetnek meg: ellenrztt (supervised), nem
ellenrztt (unsupervised) s megerstses (reinforcement) tanulst.
571
Created by XMLmind XSL-FO Converter.
2. Induktv tanuls
Egy determinisztikus, felgyelt tanulst vgz algoritmus bemenetknt megkapja az ismeretlen fggvny
bizonyos bemeneti rtkekhez tartoz vlaszait, feladata az ismeretlen fggvny vagy ahhoz nagyon kzel ll
lekpezs ellltsa. Formlisan azt mondjuk, hogy egy minta (example) nem ms, mint egy (x, f(x))
rtkpr, ahol x a bemeneti rtk, mg f(x) az x-re alkalmazott fggvny kimeneti rtke. A tisztn induktv
kvetkeztets (pure inductive inference) (vagy indukci [induction]) feladata a kvetkez:
1
572
Created by XMLmind XSL-FO Converter.
18.1. bra - (a) Plda (x, f(x)) rtkprok s egy velk konzisztens lineris hipotzis. (b)
Egy ugyanazokkal az adatokkal konzisztens hetedfok polinom. (c) Egy msik
adathalmaz egy pontosan illeszked hatodfok polinommal, illetve egy kzelt lineris
illesztssel. (d) Egy egyszer szinuszos illeszts ugyanazokra az adatokra.
Fontos
A 18.1. bra ismert pldt mutat be: egy adathalmazra egyvltozs fggvnyt illesztnk. A mintk (x,
f(x)) rtkprok, ahol mind x, mind f(x) vals rtkek. Legyen a H hipotzistr (hypothesis space H)
azon hipotzisek halmaza, amelyeket meg fogunk vizsglni a legfeljebb k-ad fok polinomok tere.
(Pldul 3x2 + 2, x17 4x3 stb.) A 18.1. (a) bra valamilyen adatokat s egy az adatokra pontosan
illeszked egyenes vonalat (elsfok polinom) mutat. Ez a vonal itt egy konzisztens (consistent)
hipotzis, mivel valamennyi adatra illeszkedik. A 18.1. (b) bra egy nagy fokszm polinomot mutat,
amely szintn konzisztens ugyanazokra az adatokra nzve. Ez a kt plda illusztrlja az induktv
tanuls els komoly megoldand krdst: hogyan vlasszunk tbb konzisztens hipotzis kzl? Egy
lehetsges vlasz az n. Ockham borotvja2 (Ockhams razor) elv: rszestsk elnyben a
legegyszerbb olyan hipotzist, amely konzisztens az adatokkal. Ez jzan intucinak tnik, mivel azok
a hipotzisek, amelyek nem egyszerbbek, mint maguk az adatok, nem nyernek ki semmilyen
mintzatot az adatokbl. Az egyszersg defincija nem knny, de rtelmesnek tnik azt mondani,
hogy egy elsfok polinom egyszerbb, mint egy 12-ed fok.
Fontos
A 18.1. (c) bra egy msik adathalmazt mutat. Ezekre az adatokra nem lehet konzisztens mdon
egyenest illeszteni, valjban egy hatodfok polinomra (amely 7 szabad paramterrel rendelkezik) van
szksg a pontos illesztshez. A halmazban csak 7 adat van, gy a polinomnak pp annyi paramtere
van, ahny adatpont. Ennek megfelelen gy tnik, hogy nem sikerl valamilyen mintzatot tallnunk
az adathalmazban, gy nem vrunk j ltalnostkpessget. Jobban jrhatunk, ha inkbb egy egyszer
egyenest illesztnk, amely ugyan nem konzisztens, de sszer becslseket adhat. Ez azt valsznsti,
hogy a keresett fggvny nem determinisztikus (vagy ami ezzel kzeltleg ekvivalens: a valdi
bemeneti mintk nem figyelhetk meg teljes pontossggal). Nemdeterminisztikus fggvnyek esetn
elkerlhetetlen, hogy kompromisszumot kssnk a hipotzis komplexitsa s az adatokhoz val
illeszkeds pontossga kztt. A 20. fejezetben bemutatjuk, hogy ezt a kompromisszumot hogyan lehet
a valsznsg-szmts elmletnek felhasznlsval kialaktani.
A 14. szzadi angol filozfus, William of Ockham utn. Ockham nevt gyakran hibsan Occamnak rjk, ami taln a francia Guillaume
dOccam fordtsbl ered.
2
573
Created by XMLmind XSL-FO Converter.
Fontos
Egy msik lehetsges megkzelts, hogy a lehet legnagyobb hipotzisteret hasznljuk. Pldul mirt
ne legyen a H hipotzisternk az sszes Turing-gpek osztlya? Vgl is minden kiszmthat
fggvny reprezentlhat valamilyen Turing-gppel, teht ez a legjobb, amit tehetnk. Ennek a
megkzeltsnek az a problmja, hogy nem veszi figyelembe a tanuls szmtsi komplexitst.
Kompromisszumot kell ktnnk a hipotzistr kifejezkpessge s egyszer konzisztens hipotzisek
megtallsnak komplexitsa kztt. Pldul: egyenesek illesztse az adatokra knnyen megoldhat,
nagy fokszm polinomok illesztse nehezebb, Turing-gpek illesztse pedig nagyon nehz. Ugyanis
annak eldntse, hogy egy adott Turing-gp konzisztens-e az adatokkal, ltalnossgban mg csak nem
is lehetsges. Egy msik ok, ami miatt elnyben rszestjk az egyszer hipotzistereket, hogy az
eredmnykpp kapott hipotzisek hasznlata is egyszerbb lehet knnyebb kiszmtani h(x)-et, ha h
egy lineris fggvny, mint ha egy tetszleges Turing-gp programja lenne.
Ezen okokbl a legtbb tanulssal foglalkoz eddigi kutats a viszonylag egyszer hipotzisreprezentcikra
helyezte a f hangslyt. Ebben a fejezetben az tletlogikra s az ehhez kapcsold nyelvekre koncentrlunk.
Az elsrend logikai reprezentcit hasznl tanuls elmletvel a 19. fejezet foglalkozik. Ltni fogjuk, hogy a
kifejezkpessg-komplexits kompromisszum nem is olyan egyszer, mint elszr gondolnnk. Gyakran az a
helyzet mint azt a 8. fejezetben is lttuk , hogy egy kifejeznyelv lehetv teszi az adatokra illesztett
egyszer elmletet, mg a nyelv kifejezkpessgnek korltozsa azt is jelenti, hogy brmely konzisztens
elmlet szksgszeren bonyolult lesz. A sakk szablyait pldul egy-kt oldalon le tudjuk rni elsrend logika
segtsgvel, mg az tletlogikval trtn lers tbb ezer oldalt ignyelne. Ilyen esetekben kell arra
lehetsgnek lennie, hogy a kifejezbb nyelven sokkal gyorsabb legyen a tanuls.
574
Created by XMLmind XSL-FO Converter.
A szerzk egyike (SR) ltal erre a problmra rendszerint hasznlt dntsi fa a 18.2. brn lthat. Vegyk
szre, hogy a fa nem hasznlja a Drga s a Konyha attribtumokat, valjban irrelevnsnak tekinti azokat. A
pldkat a dntsi fa a gykrnl kezdi feldolgozni, kveti a megfelel gakat, amg egy levlhez el nem r.
Pldul egy Vendgek = Tele s BecsltVrakozs = 010 attribtumokkal jellemezhet plda pozitv kimenetet
fog eredmnyezni (azaz vrni fogunk egy asztalra).
ahol mindegyik Pi(s) felttel azon tesztek konjunkcijnak felel meg, amelyeket a gykrtl egy pozitv
kimenetet jelent levlig megtett t sorn vgeztnk. Br ez egy elsrend logikban felrt mondatnak tnik,
valjban bizonyos rtelemben tletlogikai kifejezs, mivel csak egyetlen vltozt tartalmaz s az sszes
prediktum unris. Valjban a dntsi fa a VrjunkE s az attribtumrtkek bizonyos logikai kapcsolatt rja
le. A dntsi fa nem hasznlhat olyan tesztek reprezentlsra, amelyek kett vagy tbb klnbz objektumra
vonatkoznak pldul:
r2 Kzel(r2, r) Drga(r, p) Drga(r2, p2) Olcsbb(p2, p)
(van a kzelben egy olcsbb tterem?). Nyilvnvalan felvehetnnk egy OlcsbbtteremKzel nev logikai
attribtumot, de az sszes ilyen attribtum hozzadsa kezelhetetlenn teszi a problmt. A 19. fejezet
mlyebbre hatol az elsrend logikban trtn tanuls terletn.
Az tletlogikai nyelvek terletn a dntsi fk teljes kifejezkpessggel brnak, ami azt jelenti, hogy
tetszleges logikai (Boole) fggvny felrhat dntsi faknt. Ezt trivilisan megvalsthatjuk, ha a fggvny
igazsgtbljnak minden sort megfeleltetjk a dntsi fa egy tjnak. Ez exponencilisan nvekv dntsi
fra vezet, mivel az igazsgtbla exponencilisan nvekv szm sort tartalmaz. Nyilvnvalan a dntsi fk
sok fggvnyt jval kisebb fval kpesek reprezentlni.
Ugyanakkor nmely fggvnyfajtnl ez valban problmt jelent. Pldul ha a fggvnynk a
paritsfggvny (parity function), amely akkor s csak akkor ad 1-et, ha pros szm bemenet 1 rtk, akkor
egy exponencilisan nagy dntsi fra lesz szksg. Hasonlan nehz a tbbsgfggvny (majority function)
reprezentlsa dntsi fval, amely fggvny akkor ad 1-et, ha bemeneteinek tbb mint fele 1 rtk.
Ms szavakkal, a dntsi fk bizonyos fggvnyek esetn jk, msok esetn roszszak. Van brmilyen olyan
reprezentci, amely mindenfajta fggvny esetn hatkony? A vlasz sajnos az, hogy nincs. Ezt ltalnosan is
meg tudjuk mutatni. Vizsgljuk az sszes n bemeneti attribtummal rendelkez logikai (Boole) fggvnyt. Hny
klnbz fggvny van ebben a halmazban? Ez ppen a lehetsges felrhat igazsgtblk szmval egyezik
meg, hiszen egy fggvnyt az igazsgtblja ad meg. Az igazsgtblnak 2 n sora van, mivel minden bemeneti
esetet n attribtummal adunk meg. gy tekinthetjk a tbla vlasz oszlopt, mint egy 2n bites szmot, amely
definilja a fggvnyt. Mindegy, hogy a fggvnyek milyen reprezentcijt vlasztjuk, nhnynak (valjban
szinte mindegyiknek) a reprezentlshoz tnyleg szksg lesz ennyi bitre.
Ha 2n bitre van szksg a fggvny megadshoz, akkor n attribtum esetn
a lehetsges fggvnyek
szma.
Ez
megrzan
nagy
szm.
Pldul
csupn
hat
Boole-vltoz
esetn
is
klnbz logikai (Boole) fggvny llthat el. Szksgnk lesz nhny
szellemes algoritmusra, hogy egy ilyen hatalmas trben konzisztens hipotzist tudjunk tallni.
Nagyon fontos, hogy megklnbztessk az azonos pldt egy azonos lerssal rendelkez pldtl. Erre a fontos klnbsgre mg
visszatrnk a 19. fejezetben.
3
576
Created by XMLmind XSL-FO Converter.
Ezzel a trivilis megoldssal az a baj, hogy egyszeren memorizlja a pldkat. Mivel nem nyer ki semmilyen
mintzatot a pldkbl, ezrt nem vrhatjuk, hogy extrapollni tudjon azokra a mintkra, amelyeket mg
sohasem ltott. Az Ockham borotvja elvt alkalmazva neknk azt a legkisebb dntsi ft kell megtallnunk,
amely konzisztens a pldkkal. Sajnlatos mdon a legkisebb sszes rtelmes defincija esetn a legkisebb
dntsi fa megtallsa kezelhetetlen problmt jelent. Viszont nmi egyszer heurisztika bevetsvel j
eredmnyt rhetnk el egy kicsike fa megtallsban. A DNTSI-FA-TANULS algoritmus alaptlete az, hogy
teszteljk elszr a legfontosabb attribtumot. A legfontosabb alatt azt az attribtumot rtjk, amelyik a
legnagyobb vltozst okozza a pldk besorolsban. Ezen a mdon remnynk szerint kisszm teszttel
helyes osztlyozshoz jutunk, ami azt jelenti, hogy a fban minden t rvid lesz, teht az egsz fa kicsi lesz.
A 18.4. brn lthat, hogy hogyan indul az algoritmus. 12 pldnk van, amelyeket pozitv s negatv
pldahalmazokba sorolunk. Ezek utn eldntjk, hogy melyik attribtumot teszteljk elszr a fban. A 18.4.
(a) brn megmutattuk, hogy a Konyha attribtum rossz vlaszts lenne, mert tesztjnek 4 kimenetele van, s
mindegyik esetn ugyannyi pozitv s negatv pldnk lesz az eredmnyl kapott halmazokban. Msrszt
viszont a 18.4. (b) brn lthat, hogy a Vendgek egy meglehetsen fontos attribtum, hiszen ha rtke Senki
vagy Nhny, akkor hatrozott vlaszt tudunk adni (az els esetben Nem, a msodikban Igen a vlaszunk). Ha az
attribtum rtke Tele, akkor a pldk vegyes halmazt kapjuk. ltalnossgban megllapthat, hogy miutn az
els attribtum tesztje csoportokra bontotta a pldkat, mindegyik teszteredmny egy jabb dntsi fa tanulsi
problmt eredmnyez, kevesebb pldval s egygyel kevesebb attribtummal. Ngy esetet kell ttekintennk
ezekben a rekurzv problmkban:
1. Ha van nhny pozitv s nhny negatv pldnk, akkor vlasszuk a legjobb attribtumot a sztosztsukra. A
18.4. (b) brn bemutattuk, hogy az hes attribtum alkalmas a megmarad pldk osztlyozsra.
2. Ha valamennyi megmaradt pldnk pozitv (vagy mind negatv), akkor kszen vagyunk: vlaszolhatunk
Igen-t vagy Nem-et. A 18.4. (b) bra bemutatja ezt a Senki, illetve a Nhny esetekben.
3. Ha nem marad plda a teszt egyik kimenetele esetn, akkor ez azt jelenti, hogy nem figyeltnk meg ilyen
esetet, s a szlcsompontban tbbsgben lev vlaszt adjuk.
4. Ha nem maradt attribtumunk, amelyet tesztelhetnnk, de mind pozitv, mind negatv pldink maradtak,
akkor bajban vagyunk. Ez azt jelenti, hogy ezeknek a pldknak pontosan azonos jellemzik vannak, de
klnbz osztlyokba tartoznak. Ez egyrszt akkor fordulhat el, ha nhny adat nem megfelel, azt
mondjuk, hogy zajosak (noise) az adatok. Msrszt akkor is elllhat ez a helyzet, ha az attribtumok nem
adnak elg informcit a szituci teljes lersra, vagy a problmatr valjban nemdeterminisztikus.
Egyszer megoldsa lehet ennek a problmnak a tbbsgi szavazs hasznlata.
Termszetesen ha tbb mintt gyjtttnk volna, akkor egy, az eredetihez hasonlbb ft hozhattunk volna ltre
az induktv tanulssal. A 18.6. brn lthat fa elkerlhetetlenl hibkat is el fog kvetni; pldul sohasem ltott
578
Created by XMLmind XSL-FO Converter.
3.4. Attribtumteszt-vlaszts
A dntsi fa tanuls sorn az attribtumok kivlasztsra szolgl eljrs arra irnyul, hogy minimalizljuk az
eredmnyl kapott fa mlysgt. Az alaptlet az, hogy azt az attribtumot vlasszuk, amellyel a lehet
legmesszebbre jutunk a pldk pontos osztlyozsban. Egy tkletes attribtum a pldkat egy csupa pozitv s
egy csupa negatv pldt tartalmaz halmazra osztja. A Vendgek nem tkletes attribtum, de meglehetsen j.
Egy valjban haszontalan attribtum, mint pldul a Konyha, tesztjnek eredmnyeknt a kapott halmazokban
nagyjbl ugyanolyan arnyban lesz pozitv s negatv plda, mint az eredeti halmazban.
Mindssze arra van szksgnk, hogy formlis mrtket talljunk arra, hogy mit jelent a meglehetsen j s a
valjban haszontalan, ezek utn implementlni tudjuk a 18.5. brn lthat ATTRIBTUM-VLASZTS
fggvnyt. A mrtk akkor rje el maximumt, amikor az attribtum tkletes, s akkor legyen minimlis,
amikor az attribtumnak egyltaln nincs semmi haszna. Egy megfelel mrtk az attribtum ltal szolgltatott
informci (information) vrhat rtke, ahol az informcit abban a matematikai rtelmezsben hasznljuk,
ahogy elszr Shannon s Weaver definilta (Shannon s Weaver, 1949). Az informci defincijnak
megrtshez gondoljunk pldul annak a krdsnek a megvlaszolsra, hogy egy feldobott pnzrme fej
oldala lesz-e fell. Az, hogy a vlaszban mennyi informci rejlik, az az elzetes a priori tudstl fgg. Minl
kevesebbet tudunk, annl tbb a szolgltatott informci. Az informcielmlet bitekben mri az
informcitartalmat. Egy bit informci ahhoz elg, hogy egy olyan krdsre, amelyrl semmilyen elzetes
elkpzelsnk sem volt (pldul egy szablyos rme feldobsnak eredmnye) igen/nem vlaszt megadjunk.
ltalnossgban, ha a lehetsges vi vlaszok valsznsge P(vi), akkor a vlasz I informcitartalmt a
kvetkez sszefggs adja meg:
579
Created by XMLmind XSL-FO Converter.
Ha az rme hamistott oly mdon, hogy a dobs 99%-ban fejre jn ki, akkor I(1/100, 99/100) = 0,08 bitre van
szksg, s ha a fej kimenetel valsznsge 1-hez tart, akkor az aktulis kimenetel megjslshoz szksges
informci 0-hoz tart.
Dntsi fa tanuls esetn a megvlaszolsra vr krds az, hogy egy adott pldnak mi a helyes besorolsa.
Egy j dntsi fa vlaszt ad erre a krdsre. Mg mieltt egyetlen attribtumot teszteltnk volna, a vlaszok
valsznsgt becslhetjk a tant halmazban tallhat pozitv s negatv mintk arnyval. Tegyk fel, hogy
a tant halmazban p pozitv s n negatv plda tallhat. Ez esetben a helyes vlasz informcitartalmnak
becslse:
A 18.3. brn bemutatott tterem tant halmaz p = n = 6 mintt tartalmaz, teht 1 bit informcira van
szksgnk.
Egyetlen A attribtum tesztje nem fogja megadni mindezt az informcit, de valamennyit megad belle.
Pontosan mrni tudjuk, hogy mennyit, ha megnzzk, hogy mennyi informcira van mg szksgnk az
attribtumteszt utn. Brmely A attribtum, amely v klnbz rtket vehet fel, E1, ..., Ev rszhalmazokra
bontja az E tant halmazt, az A lehetsges rtkei szerint. Mindegyik Ei rszhalmaz pi pozitv s ni negatv
pldt tartalmaz, gy ezen az gon tovbbhaladva I(pi/(pi + ni), ni/(pi + ni)) bit informcira van szksgnk a
vlasz megadshoz. A tant halmazbl vletlen mintavtellel nyert minta esetn annak valsznsge, hogy az
A attribtum ezen a mintn az i-edik rtket veszi fel: (pi + ni)/(p + n). Ennek megfelelen az A attribtum
tesztje utn az tlagos informciszksglet, amely a plda osztlyozshoz kell:
Az ATTRIBTUM-VLASZTS fggvnyben hasznlt heurisztika csupn azt takarja, hogy vlasszuk a legnagyobb
nyeresget biztost attribtumot. Visszatrve a 18.4. brn vizsglt attribtumokhoz:
Ez megersti azt az intucinkat, hogy a Vendgek jobb attribtum a tanthalmaz rszhalmazokra szabdalsra,
mint a Konyha. Az a helyzet, hogy a Vendgek attribtumnak van a legnagyobb informcinyeresge, ezrt a
dntsi fa tanul algoritmus ennek tesztjt vlasztan a fa gykrcsompontjba.
580
Created by XMLmind XSL-FO Converter.
18.7. bra - Tanulsi grbe az tterem problmatrre vletlenszeren generlt 100 plda
esetn. A grbe 20 ksrlet eredmnyt sszegzi.
A tanul algoritmusnak nyilvnvalan nem szabad az eltt ltnia a tesztadatokat, mieltt a megtantott
hipotzist teszteltk velk. Szerencstlen mdon nagyon knny beleesni abba a hibba, hogy tants kzben a
tesztadatokra kukucsklunk (peeking). Ez tipikusan a kvetkez mdon zajlik: egy tanul algoritmus ltalban
szmos hangolsi lehetsggel rendelkezik, amellyel az algoritmus viselkedst vltoztatni tudjuk. Pldul
szmos klnbz kritrium lehet, amelyek alapjn a kvetkez attribtumot kivlasztjuk a dntsi fa
tanulsnl. Klnbz belltsok mentn szmos klnbz hipotzist generlunk, majd mindegyiket
581
Created by XMLmind XSL-FO Converter.
Valjban a nyeresg pozitv lesz, kivve azt az esetet, amikor az arnyok mind pontosan egyformk (lsd 18.10. feladat).
582
Created by XMLmind XSL-FO Converter.
val sszehasonltsval:
584
Created by XMLmind XSL-FO Converter.
A turbzs az sszes mintra wj = 1 rtkkel (azaz egy norml tant halmazzal) indul. Ebbl a halmazbl
generlja az els hipotzist, h1-et. Ez a hipotzis egyes tantmintkat jl osztlyoz, msokat rosszul. Azt
szeretnnk, ha a kvetkez hipotzis jobb eredmnyt rne el a rosszul osztlyozott mintkon, ezrt megnveljk
a rosszul osztlyozottak slyait, mg a jl osztlyozottakt cskkentjk. Ebbl az j, slyozott mintahalmazbl
generljuk a h2 hipotzist. Az eljrst addig folytatjuk, mg M hipotzist nem generltunk, ahol M a turb
tanulsi algoritmus bemen paramtere. Az algoritmus eredmnyeknt kapott hipotzis egyttes nem ms, mint
az M hipotzis slyozott tbbsgi szavazssal kombinlt eredje. A slyokat aszerint hatrozzuk meg, hogy az
egyes hipotzisek mennyire jl teljestettek a tant halmazon. A 18.9. brn bemutatjuk az algoritmus
koncepcijt. Sok varinsa ismert a turb tanulsnak, eltr slymdostssal, illetve a hipotzisek klnbz
kombinlsi lehetsgeivel. Egy kivlasztott ADABOOST nev algoritmust mutatunk be a 18.10. brn. Az
alkalmazott slymdostsi eljrs jelen esetben nem tl lnyeges, viszont az ADABOOST algoritmusnak van egy
nagyon lnyeges jellemzje. Tegyk fel, hogy a hasznlt L tanulsi algoritmus egy gyenge tanulsi (weak
learning) algoritmus, ami azt jelenti, hogy L mindig visszaad egy olyan hipotzist, amelyik legalbb egy
csppet jobban teljest a tant halmaz slyozott hibjra nzve, mint a vletlen tallgats (azaz eredmnye jobb
mint 50% binris osztlyozs esetn). Ez esetben, kellen nagy M-re az ADABOOST mindig elllt egy olyan
Azon tanulsi eljrsokra, ahol ez nem lehetsges, ismtlses tant halmazt (replicated training set) hozhatunk ltre, ahol a j-edik minta
a wj sllyal arnyos pldnyszmban szerepel. Az esetleges nem egsz slyokat gy kezelhetjk, hogy a mintaszmot valsznsgi
vltozknt fogjuk fel.
5
585
Created by XMLmind XSL-FO Converter.
18.9. bra - A turb algoritmus mkdse. Mindegyik rnykolt tglalap egy pldnak
felel meg, a tglalap magassga mutatja a plda slyt. A pipk s keresztek mutatjk,
hogy a pldt jl vagy rosszul osztlyoztuk a pillanatnyi hipotzis alapjn. A dntsi fa
mrete mutatja, hogy ennek a hipotzisnek mekkora a slya a vgs egyttesben.
Vizsgljuk meg, hogy mennyire jl mkdik a turbzs az ttermi adatainkon. Kiindul hipotzistrknt az
gynevezett dntsi tnkk (decision stumps) tert vlasztjuk, amelyek olyan dntsi fk, amelyek csupn egy
a gykrcsompontban elhelyezked tesztbl llnak. A 18.11. (a) bra als grbje mutatja, hogy turbzs
nlkl ezek a dntsi tnkk nem adnak valami j eredmnyt, csupn 81%-os a 100 mintn mrt predikcis
teljestmnyk. Amikor turbzst alkalmazunk (M = 5), akkor a teljestmny javul, elri a 93%-ot 100 plda
esetn.
586
Created by XMLmind XSL-FO Converter.
Fontos
rdekes dolog trtnik, amikor az egyttes M mrete nvekszik. A 18.11. (b) bra mutatja a tant
halmazon mrt teljestmnyt M fggvnyben. Figyeljk meg, hogy M = 20-nl a hiba elri a nullt
(ahogy a turbzssal foglalkoz elmlet megjsolta), azaz 20 dntsi tnk slyozott tbbsgi
szavazssal sszefogott kombincija elgsges a 100 mintra val pontos illeszkedshez. Ha tovbbi
tnkket adunk az egytteshez, akkor a hiba nulla marad. A grbe mutatja ugyanakkor, hogy a
teszthalmazon mrt teljestmny mg hosszasan n azutn is, hogy a tant halmazon mrt hiba elrte a
nullt. M = 20 esetn a teszthalmazon mrt teljestmny 0,95 (a hiba 0,05), M = 137-ig nvelve az
egyttes rsztvevinek szmt a teljestmny 0,98-ra n, ezutn leesik 0,95-re.
Ez a megfigyels, amely klnbz mintahalmazokra s hipotzisterekre nzve meglehetsen robusztusnak
bizonyult, nagy meglepetst keltett a felfedezsekor. Az Ockham borotvja elv azt sugallja, hogy ne tegyk a
hipotziseket komplexebb, mint szksges, de a grbe azt mutatja, hogy a predikcik javulnak, ahogy az
egyttes hipotzis sszetettebb vlik! Szmos magyarzatot javasoltak erre a jelensgre. Az egyik megkzelts
szerint a turbzs nem ms, mint a Bayes-tanuls kzeltse (lsd 20. fejezet), amely egy bizonythatan
optimlis tanulsi eljrs. Ez a kzelts javul, ahogy tbb s tbb hipotzist adunk az egytteshez. Msik
lehetsges magyarzat, hogy tovbbi hipotziseknek az egytteshez adsa lehetv teszi, hogy hatrozottabb
legyen a megklnbztets a pozitv s negatv pldk kztt, ami segt az j mintk osztlyozsban.
587
Created by XMLmind XSL-FO Converter.
Fontos
Az ebben az alfejezetben trgyalt megkzelts a tanuls szmtsi elmletn (computational
learning theory) alapul, amely az MI, a statisztika s az elmleti szmtstudomny kzs
hatrterlete. Ennek az elmletnek az alapvet elve a kvetkez: brmely slyosan hibs elmlet szinte
bizonyosan nagy valsznsggel felismerhet kisszm plda vizsglata alapjn, mivel helytelen
predikcit fog adni. Teht minden hipotzis, amely egy kielgten nagy tant pldahalmazzal
konzisztens vlaszt ad, nem valszn, hogy slyosan hibs lenne: azaz valsznleg kzeltleg
helyesnek (probably approximately correct) kell lennie. Minden olyan tanul algoritmust, amely
valsznleg kzeltleg helyes hipotziseket ad, VKH-tanul (PAC-learning) algoritmusnak
neveznk.
Van nhny bonyolultabb rsz az elbbi gondolatmenetben. A f krds a tant s a tesztpldk viszonya:
vgl is mi azt szeretnnk, ha a hipotzis nem csupn a tant halmazon lenne kzeltleg helyes, hanem
elssorban a teszthalmazon. Az alapvet feltevs az, hogy a tant s a teszthalmazt ugyanolyan valsznsgeloszlst hasznlva, vletlenszeren s fggetlenl vlasztottuk ugyanabbl a pldapopulcibl. Ezt
stacionaritsi (stationarity) feltevsnek nevezzk. A stacionaritsi feltevs nlkl az elmlet semmilyen, a
jvre vonatkoz ignnyel nem lphet fel, mivel nem lesz szksgszer kapcsolat a mlt s a jv kztt. A
stacionaritsi feltevs tmasztja al azt a gondolatot, hogy a pldkat kivlaszt eljrs nem rosszindulat.
Persze ha a tant halmaz kizrlag furcsa pldkat tartalmaz ktfej kutykat pldul , akkor a tanul
algoritmus nyilvnvalan nem tehet mst, mint sikertelen ltalnostsra jut a fell, hogy mi mdon lehet a
kutykat felismerni.
Ez ugyanaz a mennyisg, mint amelyet az elzkben bemutatott tanulsi grbkkel mrtnk a gyakorlatban.
18.12. bra - A hipotzistr sematikus brzolsa a keresett f fggvny krl felvett gmb brzolsval
Egy h hipotzist kzeltleg helyesnek (approximately correct) neveznk, ha error(h) , ahol egy kis
konstans. A bizonyts megkzeltse az, hogy megmutatjuk: N plda vizsglata utn az sszes konzisztens
hipotzis nagy valsznsggel kzeltleg helyes lesz. gy gondolhatunk egy kzeltleg helyes hipotzisre,
mint amely kzel van a keresett fggvnyhez a hipotzistrben: egy a keresett f krl felvett -gmbn (ball) bell van. A 18.12. brn bemutatjuk az sszes hipotzis H tert, amelyet kt rszre osztottunk, egyik az gmb f krl, a msik a Hrossz-szal jellt maradk.
A kvetkezk alapjn kiszmthatjuk annak valsznsgt, hogy egy slyosan hibs hr Hrossz hipotzis
konzisztens lesz az els N pldval. Tudjuk, hogy error(hr) > . Teht annak valsznsge, hogy egy adott
pldra helyes vlaszt ad, legfeljebb 1 . Ezek utn az N pldra vonatkoz sszefggs:
P(hr konzisztens N pldval) (1 )N
Annak valsznsgt, hogy Hrossz legalbb egy konzisztens hipotzist tartalmaz, a lehetsges egyedi hipotzisek
szma hatrozza meg:
P(Hrossz tartalmaz egy konzisztens hipotzist) |Hrossz|(1 )N |H|(1 )N
Kihasznltuk, hogy |Hrossz| |H|. Ezt a valsznsget valamely kellen kis rtk al akarjuk cskkenteni:
|H|(1 )N
pldt megvizsglhasson. Ennek rtelmben, ha egy algoritmus ilyen mennyisg pldval konzisztens
hipotzist ad vissza, akkor legalbb 1 valsznsggel a hibja legfeljebb . Ms szavakkal kzeltleg
helyesnek nevezzk. A szksges pldaszmot, ami s fggvnyeknt adhat meg, a hipotzistr minta
komplexitsnak (sample complexity) nevezzk.
Kiderlt, hogy kulcskrds a hipotzistr mrete. Mint korbban lttuk, ha H az n attribtumon felvehet Boolefggvnyek halmaza, akkor
. Teht a tr minta komplexitsa 2n szerint n. Mivel a lehetsges pldk
n
szma szintn 2 , ebbl az kvetkezik, hogy a Boole-fggvnyek terben egyetlen tanul algoritmus sem tud
jobb eredmnyt elrni, mint egy tblzat, ha csupn arra szortkozik, hogy egy olyan hipotzist adjon vissza,
amely az sszes ismert pldval konzisztens. Ennek megmutatsra egy msik lehetsg az, hogy megfigyeljk:
egy tetszleges ismeretlen pldra a hipotzistr ugyannyi pozitv kimenetelt jsol konzisztens hipotzist
tartalmaz, mint amennyi negatv kimenetelt jsol.
A kvetkez dilemmval kerltnk szembe: ha nem korltozzuk a szba jv fggvnyek tert, akkor az
algoritmus nem lesz kpes tanulni, viszont ha korltozzuk a fggvnyek tert, akkor fennll a veszly, hogy
kihagyjuk a keresett fggvnyt. Kt lehetsgnk van, hogy kimenekljnk ebbl a dilemmbl. Az els,
hogy nem csupn ahhoz ragaszkodunk, hogy az algoritmus egy tetszleges konzisztens hipotzist adjon vissza,
hanem ahhoz is, hogy rszestse elnyben az egyszereket (mint ahogy a dntsi fa tanulsnl tettk). Ezen
algoritmusok elmleti trgyalsa tlmegy ennek a knyvnek a keretein, de megemltjk, hogy azon esetekben,
amikor az egyszer konzisztens hipotzisek keresse kezelhet problma, a mintakomplexits-eredmnyek
jobbak, mint a csupn konzisztencin alapul vizsglatok. A msik meneklsi lehetsg, amelyet kvetni is
fogunk, hogy a Boole-fggvnyek teljes halmazbl a megtanulhat fggvnyek rszhalmazra fogunk
koncentrlni. Az tlet abban ll, hogy legtbb esetben nincs szksgnk a Boole-fggvnyek teljes
kifejezerejre, korltozottabb nyelvek is kielgtk szmunkra. A kvetkezkben egy ilyen korltozottabb
nyelvet vizsglunk meg rszletesebben.
Ha megengednk tetszleges mret teszteket, akkor a dntsi listk brmely Boole-fggvny reprezentlsra
kpesek (lsd 18.15. feladat). Msrszrl, ha az egyes tesztek mrett k literlisra korltozzuk, akkor lehetv
vlik, hogy a tanul algoritmus kisszm plda alapjn sikeresen ltalnostson. Ezt k-DL nyelvnek nevezzk.
Knynyen megmutathat, hogy a k-DL nyelvek rszhalmazknt tartalmazzk a k-DF nyelveket, amelyek a
legfeljebb k mlysg dntsi fk halmazt alkotjk. Fontos, hogy egy adott nyelv, amelyre k-DL jellssel
hivatkozunk, fgg azoktl az attribtumoktl, amelyekkel a pldkat lerjuk. A tovbbiakban k-DL(n) lesz a
jellsnk azokra a k-DL nyelvekre, amelyek n logikai attribtumot hasznlnak.
Egy dntsi lista teht szerkezetben megegyezik a Lisp nyelv cond lltsval.
590
Created by XMLmind XSL-FO Converter.
Ezt a (18.1) egyenletbe helyettestve megmutathatjuk, hogy a k-DL fggvnyek VKH-tanulshoz szksges
mintk szma polinomilisan n n-nel:
Ennek rtelmben brmely algoritmus, amely konzisztens dntsi listt ad vissza, kis k rtkek esetn
elfogadhat pldaszm alapjn VKH-tanulssal kpes ellltani egy k-DL fggvnyt.
A kvetkez feladatunk, hogy hatkony algoritmust talljunk, amely konzisztens dntsi listt eredmnyez. A
DNTSI-LISTA-TANULS nev moh algoritmust fogjuk hasznlni. Ez ismtelten tall egy olyan tesztet, amely
pontosan a tant halmaz valamely rszhalmaznak felel meg. Amikor tall egy ilyen tesztet, akkor azt
hozzadja a dntsi listhoz, egyben eltvoltva a tesztnek megfelel pldkat a tant halmazbl. Ezek utn
ltrehozza a dntsi lista htralev rszt pusztn a maradk pldkra alapozva. Ezt addig ismtli, amg nem
marad tbb plda. Az algoritmust a 18.14. bra mutatja.
Ez az algoritmus nem specifiklja, hogy milyen mdszert hasznljunk a kvetkez a dntsi listhoz adni
kvnt teszt kivlasztshoz. Br a bemutatott formlisan elrt eredmnyek nem fggnek a kivlaszts
mdszertl, mgis az ltszik jzannak, ha elnyben rszestjk azokat az egyszer teszteket, amelyek az
osztlyozott pldk nagy rszhalmazainak felelnek meg. Ennek eredmnyeknt a dntsi lista a lehet
legtmrebb lesz. A legegyszerbb stratgia, ha azt a legrvidebb t tesztet keressk meg, amely egy tetszleges,
egyforma osztlybasorolssal rendelkez rszhalmaznak megfelel, figyelmen kvl hagyva a rszhalmaz
mrett. Mg ez a megkzelts is egsz jl mkdik, mint az a 18.15. brn lthat.
5.3. Elemzs
A tanuls szmtsi elmlete j szempontbl vilgtotta meg a tanuls problmjt. Az 1960-as vek elejn a
tanuls elmlet az identifikci hatrtmenetben (identification in the limit) problmjra koncentrlt. E
szerint egy identifikcis algoritmusnak mindenkppen vissza kell adnia egy olyan hipotzist, amely pontosan
megegyezik a keresett fggvnnyel. Erre a kvetkezkben ismertetett eljrs ad egy lehetsges mdszert.
Elszr is rendezzk a H hipotzistr minden elemt valamilyen egyszersg mrtk szerint. Ezek utn
vlasszuk azt a legegyszerbb hipotzist, amely konzisztens az sszes mr rendelkezsre ll pldval. Ahogy
jabb pldk rkeznek, a mdszer fel fogja adni az egyszerbb hipotzist, ha az j pldk rvnytelentettk, s
helyette egy bonyolultabbat vlaszt. Amikor elri a keresett fggvnyt, akkor azt mr soha nem fogja feladni.
Sajnlatos, hogy szmos hipotzistrben risi nagy lehet a keresett fggvny elrshez szksges id,
valamint a szksges pldk szma. Ezrt a tanuls szmtsi elmlete nem ragaszkodik ahhoz, hogy a tanul
gens megtallja a krnyezett vezrl egyedli helyes trvnyt. Ehelyett inkbb egy olyan hipotzist keres,
amely egy bizonyos prediktv pontossgot elr. A tanuls szmtsi elmlete ezen fell ersen hangslyozza a
hipotzis nyelv kifejezkpessge s a tanuls komplexitsa kztti kompromisszum fontossgt. Ez az elmlet
vezetett egy fontos tanul algoritmus osztlyhoz, a szupport vektorgpekhez.
Az ltalunk bemutatott, VKH-tanulsra vonatkoz eredmnyek a legrosszabb esetre rvnyesek, nem felttlenl
mutatva azt az tlagos esetre vonatkoz mintakomplexitst, amelyeket viszont a bemutatott tanulsi grbk
tkrznek. Egy, az tlagos esetre vonatkoz analzisnek tovbbi felttelezsekkel kell lnie a mintk
eloszlsrl, valamint a keresett fggvnyek eloszlsrl. Mikzben ezeket a krdseket egyre jobban
megrtjk, a tanuls szmtsi elmlete folyamatosan a gpi tanulssal foglalkoz kutatk hasznos
tmutatjnak bizonyul. Ezek a kutatk algoritmusaik mdostsban vagy algoritmusaik tanulsi kpessgnek
meghatrozsban rdekeltek. A dntsi listk mellett a Boole-fggvnyek szinte minden ismert alosztlyra, a
neurlis hlkra (lsd 20. fejezet), valamint az elsrend logikai lltsok halmazaira (lsd 19. fejezet) szlettek
eredmnyek. Az elrt eredmnyek azt mutatjk, hogy a tisztn indukcis tanuls rendkvl nehz. Tisztn
indukcis tanulson azt a helyzetet rtjk, amelyben az gens nem rendelkezik semmilyen, a keresett
fggvnyre vonatkoz, elzetes ismerettel. Mint a 19. fejezetben megmutatjuk, az elzetes tudsnak az induktv
tanuls vezrlsre val felhasznlsa lehetv teszi, hogy meglehetsen nagy lltshalmazokat elfogadhat
mintaszm alapjn megtanuljunk, mg egy olyan nyelven is, amelynek kifejezereje megegyezik az elsrend
logikval.
592
Created by XMLmind XSL-FO Converter.
6. sszefoglals
Ebben a fejezetben determinisztikus fggvnyek pldk alapjn val induktv tanulsra koncentrltunk. A fbb
pontok a kvetkezk voltak:
A tanulsnak szmos formja van, amely a cselekv alrendszer jellegtl, a javtani kvnt komponenstl s a
rendelkezsre ll visszacsatolstl fgg.
Ha akr egy tanr, akr a krnyezet lehetv teszi a mintk helyes rtknek visszacsatolst, akkor
ellenrztt tanulsi (supervised learning) problmrl beszlnk. A feladat, amelyet induktv tanulsnak
(inductive learning) is nevezhetnk, abban ll, hogy egy fggvnyt kell megtanulnunk annak bemeneti s
kimeneti minti alapjn. Diszkrt rtkkszlet fggvny tanulst osztlyozsnak (classification), folytonos
rtk fggvny tanulst pedig regresszinak (regression) nevezzk.
Az induktv tanuls magban foglalja, hogy egy, a pldkkal konzisztens hipotzist kell tallnunk. Az
Ockham borotvja (Ockhams razor) elv rtelmben clszer a legegyszerbb konzisztens hipotzis
vlasztsa. Ennek a feladatnak a nehzsgt a vlasztott reprezentci dnten befolysolja.
A dntsi fk (decision trees) alkalmasak tetszleges Boole-fggvny reprezentlsra. Az
informcinyeresgre (information gain) alapoz heurisztika hatkony mdszert biztost egyszer,
konzisztens dntsi fk konstrulsra.
A tanulsi algoritmus teljestmnyt a tanulsi grbn (learning curve) mrhetjk le, amely a
teszthalmazon (test set) mrt predikcis pontossgot mutatja a tant halmaz (training set) mretnek
fggvnyben.
Az egyttes tanulsi mdszerek, pldul a turbzs (boosting), gyakran jobb eredmnyt rnek el, mint az
egyedi mdszerek.
A tanuls szmtsi elmlete (computational learning theory) az induktv tanuls minta komplexitsnak
s szmtsi komplexitsnak analzisre koncentrl. Kompromisszumot kell ktnnk a hipotzis nyelv
kifejezkpessge s a tanuls nehzsge kztt.
594
Created by XMLmind XSL-FO Converter.
6.2. Feladatok
18.1.
Vizsglja meg a beszlni, illetve egy nyelvet megrteni tanul gyerek problmjt! Magyarzza meg, hogy ez a
folyamat hogyan illeszkedik az ltalnos tanulsi modellhez, s megfelelen azonostsa a modell egyes
komponenseit!
18.2.
Ismtelje meg a 18.1. feladatot a tenisz (vagy valamilyen n ltal ismert sport) tanulsnak esetre! Ez felgyelt
vagy megerstses tanuls?
18.3.
Rajzoljon fel egy dntsi ft arra a problmra, hogy az tkeresztezdsben elinduljunk-e elre, ha a lmpa
ppen most vltott zldre!
18.4.
Soha nem teszteljk ktszer ugyanazt az attribtumot a dntsi fa egy tvonala mentn. Mirt?
18.5.
Tegyk fel, hogy egy dntsi fa segtsgvel generlunk egy tant mintahalmazt, majd dntsi fa tanulst
alkalmazunk erre a halmazra. A tanulsi algoritmus vgl is a helyes dntsi ft fogja visszaadni, ha a tant
halmaz mrete a vgtelenhez tart? Mirt, vagy mirt nem?
18.6.
Egy j butcska tanulsi algoritmus a kvetkez: ksztsnk egy tblzatot az sszes tantpldbl.
Vizsgljuk meg, hogy milyen kimenet szerepel a legtbbszr a tantpldkban: jelljk ezt d-vel. Ezek utn, ha
olyan minta jelenik meg a bemeneten, ami nincs a tblzatban, akkor adjunk vissza d-t. Olyan bemenetekre,
amelyek megtallhatk a tblban, adjuk vissza a tblzatban a bemenethez asszocilt kimeneti rtket (vagy ha
egynl tbb kimeneti rtk van azonos bemenethez, akkor a leggyakrabban elfordult). Implementlja ezt az
algoritmust, s vizsglja meg egy pldnak vlasztott terleten (pldul az tterem problmn) azt, hogy
mennyire mkdik jl! Ennek alapjn fogalmat alkothatunk a tanuls terletnek alapszintjrl a minimlis
elvrhat teljestmnyrl, amelyet minden tanul algoritmusnak el kell rnie.
18.7.
Tegyk fel, hogy egy j algoritmussal tanulsi ksrletet folytat. Egy adathalmazt hasznl, amiben 25-25 plda
van az elfordul kt osztlyra. Azt tervezi, hogy a hagyj-ki-egyet keresztvalidcis mdszert fogja hasznlni.
sszehasonltsi alapknt egy egyszer tbbsgi szavazt hasznl. (A tbbsgi szavaznak megadva egy tant
halmazt, a bemenetektl fggetlenl mindig azt a kimenetet adja, amely kimeneti rtk a halmazban legtbbszr
elfordul.) Azt vrta, hogy a tbbsgi szavaz, a hagyj-ki-egyet keresztvalidciban nagyjbl 50%-ot fog
elrni, de meglepetsre 0% az eredmny. Meg tudja magyarzni, hogy mirt?
18.8.
A dntsi fk rekurzv ellltsa sorn nha elfordul, hogy pozitv s negatv pldk vegyes halmaza marad
egy levlcsompontban, mg akkor is, ha az szszes attribtumot hasznltuk mr. Tegyk fel, hogy p pozitv s
n negatv pldnk van.
a. Mutassa meg, hogy a DNTSI-FA-TANULS algoritmusban hasznlt megolds, amely a tbbsgi osztlyozst
vlasztja, minimalizlja a pldahalmazra vonatkoz abszolt hibt a levlnl!
595
Created by XMLmind XSL-FO Converter.
596
Created by XMLmind XSL-FO Converter.
597
Created by XMLmind XSL-FO Converter.
A Di(Xi) jellssel az Xi lersra fogunk hivatkozni, ahol Di tetszleges, egyargumentum logikai kifejezs
lehet. Az objektumok osztlyozst a
VrjunkE(X1)
llts vgzi. Pozitv pldk esetn a Q(Xi), negatv pldk esetn a Q(Xi) ltalnos jellst fogjuk hasznlni. A
teljes tant halmaz az sszes ler s besorol llts konjunkcija.
Logikai megkzeltsben az induktv tanuls clja a Q clprediktummal ekvivalens logikai kifejezs
megtallsa, amivel korrektl tudjuk a pldkat osztlyozni. Mindegyik hipotzis egy-egy javaslat a keresett
logikai kifejezsre, amit mi a clprediktum defincijelltjnek (candidate definition) neveznk. Jelljk Civel a defincijelltet, ekkor mindegyik Hi hipotzis egy x Q(x) Ci(x) formj kifejezs. Pldul a dntsi fa
azt fejezi ki, hogy a clprediktum egy objektum esetben csak akkor igaz, ha az igaz-hoz vezet egyik ga
teljesl. gy a 18.6. brn lthat dntsi fa a kvetkez logikai defincit fejezi ki (amelyre a jvben Hr-rel
fogunk hivatkozni):
r VrjunkE(r) Vendgek(r, Nhny)
Vendgek(r, Tele) hes(r) Konyha(r, Francia)
598
Created by XMLmind XSL-FO Converter.
Mindegyik hipotzis azt jsolja meg, hogy pldk egy bizonyos halmaza, nevezetesen azok, amelyek kielgtik
a hipotzisdefinci jelltjt, a clprediktumnak megfelel pldk lesznek. Ezt a halmazt a prediktum
kiterjedsnek (extension) nevezzk. Kt klnbz kiterjedssel rendelkez hipotzis gy logikailag
ellentmondsban van egymssal, hiszen legalbb egy plda esetn eltr eredmnyt jsolnak. Ha viszont azonos
a kiterjedsk, akkor logikailag ekvivalensek.
A H hipotzistr ezek utn az sszes olyan hipotzis {H1, , Hn} halmaza, amelyek kezelsre a tanul
algoritmust terveztk. Pldul DNTSI-FA-TANULS algoritmus az adott attribtumokkal kialakthat sszes
dntsi fa hipotzissel kpes foglalkozni; gy hipotzistere az sszes dntsi ft tartalmazza. Felteheten a
tanul algoritmus hisz abban, hogy az egyik hipotzis korrekt, azaz hisz a
H1 H2 H3 Hn (19.2)
logikai kifejezsben. Ahogy a pldk rkeznek, a pldkkal nem konzisztens (consistent) hipotziseket ki lehet
zrni. Vizsgljuk meg alaposabban a konzisztencia ezen fogalmt. Nyilvnval, hogy ha a Hi hipotzis a teljes
tant halmazzal konzisztens, akkor mindegyik pldval konzisztensnek kell lennie. Mit jelent viszont az, hogy
valamelyik pldval ellentmondsban van? Ez ktfle mdon trtnhet meg:
A hipotzis szempontjbl egy plda hamis negatv (false negative), ha a valsgban pozitv, de a hipotzis
szerint negatv. Pldul a kvetkez lerssal rendelkez X13 j plda:
Vendgek(X13, Tele) BecsltVrakozsE(X13, 0-10) hes(X13) VrjunkE(X13)
a korbban definilt Hr hipotzis szmra hamis negatv plda lesz. Hr-bl, illetve a plda lersbl
kikvetkeztethet mind a VrjunkE(X13) ezt lltja a plda, mind a VrjunkE(X13) ezt lltja a hipotzis.
Teht a hipotzis s a plda logikailag ellentmondsban van.
A hipotzis szempontjbl egy plda hamis pozitv (false positive), ha a valsgban negatv, de a hipotzis
szerint pozitv.1
Ha egy plda hamis negatv vagy hamis pozitv egy hipotzis szempontjbl, akkor a plda s a hipotzis
logikailag ellentmondsban van egymssal. Feltve, hogy a plda a tnyek korrekt megfigyelsn alapul, a
hipotzist kizrhatjuk. Logikailag ez a kvetkeztets a rezolcis szabllyal pontos analgiban van (lsd 9.
fejezet). Hipotzisek diszjunkcija felel meg egy klznak, a plda pedig megfelel annak a literlisnak, amely a
klzban lev egyik literlissal rezolvl. Egy szoksos logikai kvetkeztet rendszer teht elmletileg tud
pldkbl tanulni oly mdon, hogy egy vagy tbb hipotzist kizr. Tegyk fel pldul, hogy a pldt az I1
lltssal jelljk, s a hipotzistr H1 H2 H3 H4. Ha I1 ellentmondsban van H2-vel s H3-mal, akkor a
logikai kvetkeztet rendszer szrmaztatni tudja az j H1 H4 hipotzisteret.
Teht az induktv tanulst logikai lerssal olyan folyamatknt jellemezhetjk, mint amelyik fokozatosan kizrja
a pldknak ellentmond hipotziseket, leszktve a lehetsgek krt. Mivel a hipotzistr rendszerint nagy
(vagy elsrend logika esetn egyenesen vgtelen), nem javasoljuk egy rezolcialap ttelbizonyt rendszer
ptst s a hipotzistr teljes szmbavtelt. Ehelyett kt megkzeltst trgyalunk, amelyek sokkal kisebb
erfesztssel logikailag ellentmondsmentes hipotziseket kpesek tallni.
599
Created by XMLmind XSL-FO Converter.
rkezik. Mit csinljunk? A 19.1. (a) bra sematikusan gy mutatja be Hr-t, mint egy terletet, a ngyszgn
bell minden Hr kiterjedsbe tartozik. Az eddig ltott pldkat + vagy jelli, s lthat, hogy Hr jl
sorolja be az sszes pldt, mint VrjunkE pozitv vagy negatv pldit. A 19.1. (b) brn egy j hamis negatv
plda jelenik meg (bekarikzva): a hipotzis azt lltja, hogy negatv, pedig valjban pozitv plda. A
hipotzis kiterjedst nvelni kell ahhoz, hogy tartalmazza ezt a pldt is. Ezt a lpst ltalnostsnak
(generalization) nevezzk: egy lehetsges ltalnosts a 19.1. (c) brn lthat. Ezutn a 19.1. (d) brn egy
hamis pozitv pldt ltunk: a hipotzis azt lltja, hogy pozitv, pedig valjban negatv. A hipotzis
kiterjedst cskkenteni kell ahhoz, hogy kizrjuk ezt a pldt. Ezt szktsnek (specialization) nevezzk; a
19.1. (e) brn a hipotzis egy lehetsges szktst ltjuk.
19.1. bra - (a) Egy konzisztens hipotzis. (b) Egy hamis negatv plda. (c) A hipotzist
ltalnostottuk. (d) Egy hamis pozitv plda. (e) A hipotzist szktettk.
Teht ahhoz, hogy a H2 hipotzis ltalnostst ltrehozzuk, egyszeren egy olyan C1 defincit kell tallnunk,
amelyik logikailag kvetkezik C2-bl. Ezt knnyen megtehetjk. Ha pldul C2(x) Alternatva(x) Vendgek(x,
Nhny), akkor egy ltalnostsi lehetsg a C1(x) Vendgek(x, Nhny). Ezt felttelek trlsnek (dropping
conditions) nevezzk. Felfoghatjuk gy, hogy egy gyengbb definci jn ltre, gy a pozitv pldk nagyobb
halmazt teszi lehetv. Szmos egyb ltalnostsi eljrs is ltezik, azon nyelvtl fggen, amelyen a
600
Created by XMLmind XSL-FO Converter.
mveleteket vgezzk. Hasonlkppen, egy hipotzist szkteni tudunk, ha tovbbi feltteleket adunk a hozz
tartoz defincijellthz, illetve ha eltvoltunk tagokat egy diszjunktv defincibl. Lssuk, hogyan mkdik
ez az ttermi feladatban, 18.3. bra adatait hasznlva:
Az els plda X1 pozitv. Alternatva(X1) igaz, teht vegyk fel a kvetkez kiindul hipotzist:
H1: x VrjunkE(x) Alternatva(x)
A msodik plda X2 negatv. H1 alapjn pozitv lenne, gy hamis pozitv. Ezrt szktennk kell H1-et. Ezt
megtehetjk pldul gy, hogy egy olyan tovbbi felttelt adunk hozz, amely felttel kizrja X2-t. Egy
lehetsg:
H2: x VrjunkE(x) Alternatva(x) Vendgek(x, Nhny)
A harmadik plda X3 pozitv. H2 alapjn negatv lenne, gy hamis negatv. Teht ltalnostanunk kell H2-t.
Ezt elrhetjk, ha trljk Alternatva felttelt, amely a kvetkez hipotzisre vezet:
H3: x VrjunkE(x) Vendgek(x, Nhny)
A negyedik plda X4 pozitv. H3 alapjn negatv lenne, gy hamis negatv. gy ltalnostanunk kell H3-at.
Nem trlhetjk Vendgek felttelt, mert ez egy mindent tartalmaz hipotzishez vezetne, ami
ellentmondsban van X2-vel. Egyik lehetsg a kvetkez diszjunkci bevezetse:
H4: x VrjunkE(x) Vendgek(x, Nhny)
(Vendgek(x, Tele) Pntek/Szombat(x))
A hipotzis ezek utn mr kezd sszernek tnni. Nyilvnval, hogy ms lehetsgek is vannak, amelyek
konzisztensek az els ngy pldval, kett ezek kzl:
Ahogy egyre tbb hipotzis bizonyul a pldkkal inkonzisztensnek, ez a diszjunktv llts zsugorodik, csak
azokat a hipotziseket tartva meg, amelyeket nem szrtnk ki. Feltve, hogy az eredeti hipotzistr tartalmazza
a helyes vlaszt, a reduklt diszjunktv lltsnak is szksgszeren tartalmaznia kell azt, hiszen csak inkorrekt
601
Created by XMLmind XSL-FO Converter.
hipotziseket szrtnk ki. A megmaradt hipotzisek halmazt nevezzk verzitrnek (version space). Az ilyen
elven mkd tanulsi algoritmust (amelyet a 19.3. brn vzoltunk fel) verzitr tanulsi algoritmusnak (ms
nven jellteltvoltsi candidate elimination algoritmusnak) nevezzk.
19.3. bra - Verzitr tanul algoritmus. V-nek olyan rszhalmazt tanulja meg,
amelynek elemei a pldkkal konzisztensek.
Fontos tulajdonsga ennek a megkzeltsnek, hogy inkrementlis: soha nem kell visszalpnnk s
jravizsglnunk a rgi pldkat. Az sszes megmaradt hipotzis garantltan konzisztens az sszes pldval.
Msrszt legkisebb megkts elv (least commitment) algoritmusnak is nevezhetjk, ugyanis nem tesz
nknyes vlasztsokat (v. a 11. fejezetben tallhat rszben rendezett tervkszt algoritmussal). Van viszont
egy nyilvnval problma. Mr leszgeztk, hogy a hipotzistr risi, hogyan tudjuk akkor lerni ezt az risi
diszjunktv lltst?
602
Created by XMLmind XSL-FO Converter.
A kvetkez egyszer analgia sokat segt a megrtsben. Hogyan brzoljuk az szszes 1 s 2 kz es vals
szmot? Vgl is vgtelen sok ilyen van! A megolds az intervallumbrzols, amelyik csak a halmaz hatrait
specifiklja: [1, 2]. Ez azrt mkdik, mert a vals szmok felett rtelmezett egy rendezs.
A hipotzistr felett is rendelkeznk rendezssel, nevezetesen az ltalnosts/szkts alapjn. Ez egy rszleges
rendezs, ami azt jelenti, hogy a hatr nem egy pont, hanem a hipotzisek egy halmaza: a hatrhalmaz
(boundary set). A nagyszer a dologban az, hogy a teljes verzitr reprezentlhat csupn kt hatrhalmaz: egy
legltalnosabb hatrhalmaz (a G halmaz) s egy legszkebb hatrhalmaz (az S halmaz) segtsgvel. E kett
kz es brmely hipotzis garantltan konzisztens az sszes pldval. Mieltt ezt bizonytjuk, rviden foglaljuk
ssze az eddigieket:
A jelenlegi verzitr azon hipotzisek halmaza, amelyek az sszes eddigi pldval konzisztensek. Ezt az S
halmaz s a G halmaz segtsgvel brzoljuk, mindkett a hipotzisek valamilyen halmaza.
Az S halmaz sszes eleme konzisztens az sszes eddigi megfigyelssel, s nincs ennl szkebb konzisztens
hipotzis.
A G halmaz sszes eleme konzisztens az sszes eddigi megfigyelssel, s nincs ennl ltalnosabb
konzisztens hipotzis.
Azt kvnjuk meg, hogy a kezdeti tr (mieltt brmelyik pldt megvizsgltuk volna), az sszes elkpzelhet
hipotzist tartalmazza. Ezt gy biztostjuk, hogy a G halmazt egyszeren az Igaz rtkre lltjuk (az a hipotzis,
amely mindent tartalmaz), az S halmazt pedig egyszeren a Hamis rtkre lltjuk (az a hipotzis, amelynek
kiterjedse res).
A 19.4. bra a verzitr hatrhalmazokkal val brzolsnak ltalnos struktrjt mutatja. Ahhoz, hogy
megmutassuk, hogy ez az brzols elgsges, kt tulajdonsgra van szksgnk:
603
Created by XMLmind XSL-FO Converter.
1. Mindegyik konzisztens hipotzis (amelyik nem valamelyik hatrhalmaz eleme) szkebb, mint a G halmaz
valamelyik eleme, s ltalnosabb, mint az S halmaz valamelyik eleme. (Azaz nincsenek kvl kbor
elemek.) Ez kzvetlenl kvetkezik az S s G defincijbl. Ha lenne egy kbor h, akkor az vagy nem
lehetne szkebb G valamely elemnl, teht G-hez kellene tartoznia, vagy nem lehetne ltalnosabb S
valamely elemnl, ebben az esetben viszont S-hez tartozna.
2. Mindegyik hipotzis, amelyik szkebb a G halmaz valamely elemnl, s ltalnosabb az S halmaz valamely
elemnl, konzisztens hipotzis (azaz a hatrok kztt nincsenek lyukak). Brmely az S s G kz es
h-nak az sszes olyan negatv pldt vissza kell utastania, amelyet G minden egyes tagja visszautast (mivel
szkebb), ugyanakkor el kell fogadnia az sszes pozitv pldt, amelyet az S akrmelyik tagja elfogad (mivel
ltalnosabb). gy h az sszes pldt jl kezeli, teht nem lehet inkonzisztens. A 19.5. bra mutatja be a
helyzetet: nincs ismert plda, amely S-en kvl, de G-n bell helyezkedik el, gy a kett kzt elhelyezked
sszes hipotzisnek konzisztensnek kell lennie.
Bemutattuk teht, hogy ha S-t s G-t defincijuknak megfelelen kezeljk, akkor a verzitr kielgt lerst
adjk. Az egyetlen htralv problma, hogy hogyan mdostsuk S-t s G-t egy j plda esetn (a VERZI-TRMDOSTS fggvny feladata). Elsre ez meglehetsen bonyolultnak tnik, de a defincik s a 19.4. bra
alapjn nem tl nehz az algoritmus ellltsa.
Az S s G halmazok Si s Gi elemeivel kell foglalkoznunk. Az j plda brmelyik esetn lehet hamis pozitv
vagy hamis negatv.
1. Si-re hamis pozitv. Azt jelenti, hogy Si tl ltalnos, de mivel Si-nek (a defincija rtelmben) nincs
konzisztens szktse, gy Si-t eltvoltjuk az S halmazbl.
2. Si-re hamis negatv. Azt jelenti, hogy Si tl szk, gy Si-t az sszes kzvetlen ltalnostsval helyettestjk,
feltve, hogy ezek szkebbek, mint G egyes elemei.
3. Gi-re hamis pozitv. Azt jelenti, hogy Gi tl ltalnos, gy az sszes kzvetlen szktsvel helyettestjk,
feltve, hogy ezek ltalnosabbak, mint S egyes elemei.
604
Created by XMLmind XSL-FO Converter.
4. Gi-re hamis negatv. Azt jelenti, hogy Gi tl szk, de mivel nincs konzisztens ltalnostsa (defincija
rtelmben), gy Gi-t eltvoltjuk a G halmazbl.
Ezeket a mveleteket minden j pldra elvgezzk addig, amg az albbi hrom eset valamelyike fel nem lp:
1. Pontosan egy hipotzis marad a verzitrben, ebben az esetben ezt adjuk vissza mint az egyetlen hipotzist.
2. A verzitr sszeomlik vagy S, vagy G ress vlik, azt jelezve, hogy nincs a tant halmazra nzve
konzisztens hipotzis. Ez megegyezik az egyszer dntsi fa algoritmus sikertelen kimenetelvel.
3. Kifogyunk a pldkbl, mikzben szmos hipotzis maradt a verzitrben. Ez azt jelenti, hogy a verzitr a
hipotzisek diszjunkcijt reprezentlja. Ha egy j plda esetn a diszjunkci sszes tagjban azonos
eredmnyt kapunk, akkor ezt adhatjuk vissza mint a plda besorolst. Ha az eredmnyek nem egyeznek
meg, akkor egyik lehetsgknt alkalmazhatjuk a tbbsgi szavazst.
Gyakorls cljra hagyjuk a VERZI-TR-TANULS algoritmusnak az ttermi adatokra val alkalmazst.
A verzitr megkzeltsnek kt alapvet htrnya van:
Ha a problmaterlet adatai zajt tartalmaznak, vagy ha az attribtumok a pontos besorolshoz nem
elgsgesek, akkor a verzitr mindig sszeomlik.
Ha korltlan mret diszjunkcit megengednk a hipotzistrben, akkor az S halmaz mindig tartalmazni fog
egy egyedi legszkebb hipotzist, nevezetesen az sszes eddig ltott pozitv plda diszjunkcijt.
Hasonlkppen a G halmaz tartalmazni fogja a negatv pldk diszjunkcijnak negltjt.
Egyes hipotzistereknl az S- s a G-beli elemek szma az attribtumok szmban exponencilisan
nvekedhet annak ellenre, hogy az ilyen hipotzisterekhez ismertek hatkony tanul algoritmusok.
A zaj problmjra napjainkig nem ismert teljes, sikeres megolds. A diszjunktv kapcsolatok problmja
kezelhet oly mdon, hogy csak korltozott mret diszjunktv formkat engednk meg, vagy az ltalnosabb
prediktumokra egy ltalnostsi hierarchit (generalization hierarchy) vezetnk be. Pldul a
BecsltVrakozs(x, 30-60) BecsltVrakozs(x, >60) helyett hasznlhatjuk a HosszVrakozs(x) literlt.
Az ltalnostsi s a szktsi mveletek egyszeren kiterjeszthetk ennek kezelsre.
A verzitr algoritmus tiszta vltozatt elszr a Meta-DENDRAL rendszerben alkalmaztk. Ezt a rendszert olyan
szablyok megtanulsra terveztk, amelyek azt rjk le, hogy egy tmegspektromterben a molekulk hogyan
esnek szt darabokra (Buchanan s Mitchell, 1978). A Meta-DENDRAL kpes volt olyan szablyok generlsra,
amelyek elg jak voltak egy analitikus kmival foglalkoz jsgban val publiklhatsghoz. Ezek voltak az
els egy szmtgpes program ltal felfedezett vals tudomnyos eredmnyek. Az algoritmust az elegns
LEX rendszerben (Mitchell s trsai, 1983) szintn hasznltk, ez a rendszer sajt sikereinek s kudarcainak
tanulmnyozsa alapjn szimbolikus integrlsi problmk megoldsnak megtanulsra volt kpes. Br a
verzitr-mdszerek valsznleg a legtbb vals problma tanulsa esetn fleg a zaj miatt nem
praktikusak, j betekintst adnak a hipotzistr logikai szerkezetbe.
(19.3)
605
Created by XMLmind XSL-FO Converter.
konzisztens hipotziseket kellene elnyben rszesteni, valami jobbat kell teht kitallnunk annl, minthogy
csupn a pldkat memorizljuk.
Fontos
Az induktv tanuls ezen egyszer kpe az 1980-as vek elejig uralkodott. A korszer megkzelts
az, hogy olyan genseket terveznk, amelyek mr tudnak valamit, s amelyek igyekeznek, hogy mg
tbbet tudjanak. Lehet, hogy ez nem tnik flelmetesen mly gondolatnak, azonban igen nagy
klnbsget jelent, ha az gensek tervezst tekintjk. St az is lehet, hogy ez a megkzelts
valamilyen mrtkben hozzjrul annak megrtshez, hogy a tudomny maga hogyan mkdik. Az
ltalnos sma a 19.6. brn lthat.
Amennyiben egy httrtudst felhasznl autonm tanul genst szeretnnk felpteni, az gensnek legelszr
valamilyen mdszerrel meg kell szereznie a httrtudst, hogy utna azt az j tanulsi epizdokban
felhasznlhassa. E mdszernek nmagban is egy tanulsi folyamatnak kell lennie. Az gens lettjt gy
kumulatv vagy inkrementlis fejlds jellemzi. Az gens felttelezheten a semmibl kezdhet, egy j kis
induktv program mintjra. Ha egyszer azonban evett mr a Tuds Fjbl, tbb ilyen naiv spekulcira nem
adhatja a fejt, s a httrtudst a minl hatsosabb tanulsra kell fordtania. A krds most az, hogyan tudjuk
ezt megvalstani.
606
Created by XMLmind XSL-FO Converter.
Fontos
Ezek mind olyan esetek, amikor a httrtuds felhasznlsa sokkal gyorsabb tanulst tesz lehetv
ahhoz kpest, mint amit a tisztn induktv programtl el lehetne vrni.
Fontos
Az els knyszer a (19.3) kplettel megegyezik, azrt a MAT-ot eredetileg a pldkbl val tanuls
jobb mdszernek tekintettk. Azonban amiatt, hogy a httrtudsnak elegendnek kell lennie a
Hipotzis megmagyarzshoz is, ami viszont a megfigyelst magyarzza meg, a megfigyelt esetbl az
gens igazbl semmi tnyszeren jat nem tanul. Az gens a pldt akr ki is kvetkeztethette volna az
ismert tudsanyag alapjn, br elkpzelhet, hogy ez elfogadhatatlan mennyisg szmtssal jrt volna
egytt. jabban a MAT-ot gy tekintik, mint az egyik olyan mdszert, amely elsdleges elmleteknek
specilis cl tudsba val konvertlst vgzi. A MAT algoritmussal a 19.3. alfejezetben
foglalkozunk.
A Brazliba utaznak egszen ms a helyzete. Az utas szksgszeren nem is kpes megmagyarzni, hogy
Fernando mirt beszl gy, ahogy beszl, amg az idevg ppai bullkat nem ismeri. Az ltalnostsra
azonban kpes lesz a trtnelemben teljesen jratlan utas is. Ebben az esetben a relevns httrtuds az, hogy
minden egyes orszgban az emberek tbbsge ugyanazt a nyelvet beszli. Azt azonban nem ttelezzk fel, hogy
minden brazil embert Fernandnak hvnak, mert az effajta szablyossg a nevekre nem vonatkozik.
Hasonlkppen, az elsves fizikushallgat is nehezen tud magyarzatot adni a rznl felfedezett vezetsi s
srsgi rtkekre. Azt azonban tudja, hogy a vezetst az objektum anyaga s annak hmrsklete hatrozza
meg egyttesen. Mindegyik esetben az a priori Httrtuds szerepe az, hogy a clprediktum szempontjbl
relevns tulajdonsghalmazok krlhatrolhatk legyenek. Ez a tuds megfigyelsekkel egytt lehetv teszi,
hogy az gens j, ltalnos szablyt hozzon ltre megfigyelseinek megmagyarzsra:
Hipotzis Lersok Besorolsok
Httertuds Lersok Besorolsok Hipotzis (19.4)
Ezt a fajta ltalnostst relevanciaalap tanulsnak vagy RAT-nak (relevance-based learning, RBL)
nevezzk (br ez az elnevezs mg nem mondhat teljesen elfogadottnak). Vegyk szre, hogy annak ellenre,
hogy a RAT a megfigyelsek tartalmt felhasznlja, a megfigyelsek s a httrtuds logikai tartalmn tlmutat
hipotziseket nem eredmnyez. Ez a tanuls egy deduktv formja, s egymagban nem lehet felels j
tudsanyagnak az alapokbl val ltrehozsrt.
A szakrtt figyel orvostanhallgat esetben felttelezzk, hogy a hallgat elzetes tudsa elegend ahhoz,
hogy a pciens D betegsgt a tnetekbl megllaptsa. Ez azonban nem elegend annak indoklsra, hogy az
orvos mirt ppen az M orvossgot rta fel. A hallgatnak egy msik szablyt kell javasolnia, azaz, hogy az M
orvossg a D-vel szemben hatsos. Ezzel a szabllyal s a hallgat elzetes tudsval most mr kpes
magyarzatot adni, hogy az orvos ebben a konkrt esetben mirt az M gygyszert rja fel. A pldt
ltalnosthatjuk egy vonzatknyszer megadsval:
Httrtuds Hipotzis Lersok Besorolsok (19.5)
607
Created by XMLmind XSL-FO Converter.
Fontos
Pldk magyarzatt teht a httrtuds s az j hipotzis egyttesen adja meg. A tisztn induktv
tanulshoz hasonlan a tanul algoritmusnak a lehet legegyszerbb s a knyszerekkel konzisztens
hipotziseket kellene ellltania. A (19.5) knyszert teljest algoritmusokat tudsalap induktv
tanulsnak vagy TIT-nek (knowledgebased inductive learning, KBIL) nevezzk.
A 19.5. alfejezetben rszletesen lert TIT algoritmusokat fleg az induktv logikai programozs, ILP
(inductive logical programming) terletn tanulmnyoztk. Az elzetes tudsnak egy ILP-rendszerben kt
kulcsszerepe van a tanuls komplexitsnak cskkentsben:
1. Tekintettel arra, hogy a megfogalmazott hipotzisek mindegyiknek konzisztensnek kell lennie a
megfigyelsekkel s az elzetes tudssal is, tnylegesen egy reduklt hipotzistrrel van dolgunk, hiszen ez a
hipotzistr csakis azokat az elmleteket tartalmazza, amelyek az eddig ismert dolgokkal konzisztensek.
2. Brmilyen adott megfigyelshalmaz esetn a megfigyelsek magyarzatt megad hipotzis lnyegesen
reduklt mret lehet, hiszen a megfigyelseket magyarz j szablyok meghatrozshoz az elzetes tuds
is rendelkezsnkre ll. Viszont minl kisebb a hipotzis, annl knnyebb azt megtallni.
Az a priori tuds befogadsn tl, az ILP-rendszerek kpesek arra, hogy hipotziseket ltalnos elsrend
logikban s nem a 18. fejezetben hasznlt, korltozott attribtumalap nyelven fogalmazzk meg. Ez azt is
jelenti, hogy az ILP-rendszerek kpesek olyan krnyezetekben tanulni, amelyek rthetetlenek az egyszerbb
rendszerek szmra.
3. Magyarzatalap tanuls
Ahogy a fejezet bevezetjben elmagyarztuk, a magyarzatalap tanuls olyan mdszer, ami megfigyelsekbl
ltalnos szablyokat nyer ki. Tekintsk pldul az algebrai kifejezsek egyszerstst s differencilst (lsd
9.15. feladat). X2-et X szerint differencilva 2X-et kapunk (vegyk szre, hogy az aritmetikai ismeretlent nagy X
betvel jelljk az x logikai vltoztl megklnbztetve). Egy logikai kvetkeztet rendszerben a clt gy a
KRDEZ(Derivlt(X2, X) = d, TB) kifejezssel fejezhetjk ki, ahol a megolds a d = 2X.
Brki, aki a differencilszmtst ismeri, a megoldst rnzsre tudja. Az ilyen problmkkal els alkalommal
tallkoz hallgatnak vagy netn a tapasztalatot nlklz programnak sokkal nehezebb lesz a dolga. A
differencils kzismert szablyai segtsgvel a kifejezst elbb-utbb az 1 (2 (X(21))) alakra lehet hozni, s
ez elbb-utbb elvezet minket a 2X-hez. A szerzk logikai programjnak ez 136 bizonytsi lpsbe kerlt,
amibl 99 lps a bizonyts zskutca elgazsaira esett. Ezt tapasztalva azt szeretnnk, ha a program
ugyanennek a problmnak a megoldst a kvetkez alkalommal lnyegesen gyorsabban adn meg.
A memoizls (memoization) mdszert a szmtgp-tudomnyban rgta alkalmazzk, miszerint a
szmtsok meggyorsthatk az eredmnyek eltrolsa rvn. A memofggvny alapgondolata, hogy
bemenet/kimenet prokat gyjtnk ki egy kln adatbzisba. Meghvskor a fggvny elszr megvizsglja az
adatbzist, htha a problma teljes jbli megoldst gy meg tudja kerlni. A magyarzatalap tanuls ezt az
tletet tovbbfejleszti gy, hogy egy ltalnos szablyt fogalmaz meg, amely az esetek egsz osztlyt kpes
lefedni. A differencils esetben a memoizls emlkezne ugyan arra, hogy az X2-nek X szerinti derivltja 2X, a
Z2 Z szerinti derivltjnak kiszmtst azonban teljes egszben az gensre hagyn. Clszer lenne, ha egy
olyan ltalnos szablyt2 tudnnk megfogalmazni, amely minden lehetsges u aritmetikai ismeretlen esetn
megadn, hogy az u2-nek u szerint derivltja 2u. A logikban ezt az albbi szabllyal fejezhetjk ki:
AritmetikaiIsmeretlen(u) Derivlt(u2, u) = 2u
Ha a tudsbzis rendelkezik egy ilyen szabllyal, akkor minden j eset, ami a szably egy pldnya, azonnal
megoldhat.
Fontos
Termszetesen ez csupn egy trivilis plda egy igen ltalnos jelensgre. Ha egyszer megrtettnk
valamit, azt ltalnostva ms krlmnyek kztt is felhasznlhatjuk. Egy nyilvnval megoldsi
Termszetesen az un ltalnos szablyt is meg tudnnk valstani, a mondanivalt azonban a kzlt plda is jl illusztrlja.
608
Created by XMLmind XSL-FO Converter.
Annak bizonytsa, hogy a vlasz X, a 19.7. bra fels rszben lthat. A MAT-mdszer egyidben kt
bizonytsi ft konstrul. A msodik bizonytsi fa a szabad vltozkkal rendelkez clt hasznlja, ahol az
eredeti cl konstansait vltozkkal helyettestettk. Ahogy az eredeti bizonyts halad elre, gy halad a szabad
vltozs bizonyts is, pontosan ugyanazokat a szablyokat alkalmazva. Lehetsges, hogy nhny vltozt
kzben le kell ktni. Ahhoz, hogy az trs(1 u, u) szablyt hasznlhassuk, az trs(x (y + z), v) rszcl x
vltozjt 1-re kell lektni. Hasonlkppen az trs(y + z, v') rszcl y vltozjt 0-ra kell lektni, ha az
trs(0 + u, u) szablyt szeretnnk alkalmazni. Az ltalnostott bizonytsi fa birtokban a levelekbl (a
szksges ktseket figyelembe vve) a clprediktum ltalnos szablyt kpezzk:
trs(1 (0 + z),0 + z) trs(0 + z, z) AritmetikaiIsmeretlen(z)
Egyszersts(1 (0 + z), z)
Vegyk szre, hogy a bal oldal els kt felttele igaz fggetlenl attl, hogy z-nek mi az rtke. gy ezeket
kihagyhatjuk a szablybl, s eredmnyl azt kapjuk, hogy:
AritmetikaiIsmeretlen(z) Egyszersts(1 (0 + z), z)
ltalnossgban elmondhat, hogy a vgleges szablybl azok a felttelek hagyhatk ki, amelyek nem
jelentenek knyszert a szably jobb oldaln lv vltozkra vonatkozlag. Az eredmnyl kapott szably
tovbbra is igaz, st mg hatkonyabb is lesz. Vegyk szre azt is, hogy az AritmetikaiIsmeretlen(z) felttel nem
hagyhat ki, hiszen a z-nek nem minden lehetsges rtke aritmetikai ismeretlen. A z ms jelleg rtkei esetn
609
Created by XMLmind XSL-FO Converter.
610
Created by XMLmind XSL-FO Converter.
A 19.7. brn lthat ltalnostott bizonytsi fbl tbb ltalnostott szablyt is kpesek vagyunk kinyerni. Ha
a fa jobb oldali gnak nvekedst lelltjuk, vagy az gat lemetsszk (prune), amikor Primitv lpshez
jutottunk, az albbi szablyt kapjuk:
Primitv(z) Egyszersts(1 (0 + z), z)
Fontos
A hatkonysg empirikus elemzsnek gondolata a MAT lnyegt rinti. Amit eddig informlisan az
adott tudsbzis hatkonysgnak neveztnk, az nem ms, mint egy tlagos esetkomplexits a
megoldand problmk egy eloszlsn mrve. A rgi pldk ltalnostsval a MAT nveli a
tudsbzis hatkonysgt a jvben sszeren vrhat problmk szempontjbl. Az tlet addig j,
amg a rgi pldk eloszlsa durvn megegyezik a jvbeli pldk eloszlsval. Ez a felttelezs
azonos azzal, amit a 18.5. alfejezetben a VKH-tanuls kapcsn megtettnk. Ha a MAT-rendszert
gondosan kiviteleztk, a ksbbi problmknl lnyeges javuls rhet el. Egy nagyon nagy mret,
svd s angol nyelv kztti beszdfordtsra kifejlesztett, Prolog-alap, termszetes nyelvi rendszerben
611
Created by XMLmind XSL-FO Converter.
pldul, a vals idej fordtsi kpessget csak az elemz folyamatra alkalmazott MAT rvn sikerlt
elrni (Samuelsson s Rayner, 1991).
A (19.6) tpus mondatok szigor relevancit fejeznek ki: a nemzetisg teljesen meghatrozza a nyelvet.
Mskppen fogalmazva: a nyelv a nemzetisg fggvnye. Az ilyen mondatokat funkcionlis fggsgeknek
(functional dependencies) vagy meghatrozsoknak (determinations) nevezzk. Bizonyosfajta
alkalmazsoknl (pldul az adatbzisrendszer-tervek specifiklsnl) ezek annyira ltalnosan fordulnak el,
hogy a felrsukhoz specilis szintaxist hasznlnak. Davies (Davies, 1985) jellsvel lve:
Nemzetisge(x, n) Nyelve(x, l)
Ez persze csak egy egyszer szintaktikai nyalnksg, azonban vilgosan mutatja, hogy egy meghatrozs
valjban prediktumok kztti relci: a nemzetisg meghatrozza a nyelvet. Az anyag vezetkpessgt s
srsgt meghatroz relevns tulajdonsgokat hasonlkppen kifejezhetjk:
Anyaga(x, m) Hmrsklete(x, t) Vezetkpessge(x, )
Anyaga(x, m) Hmrsklete(x, t) Srsge(x, d)
612
Created by XMLmind XSL-FO Converter.
lehetsges nyeresg mennyisgileg is kifejezhet. Emlkezznk arra, hogy egy Boole-fggvny esetn log(|H|)
szm plda (ahol |H| a hipotzistr mrete) szksges ahhoz, hogy egy elfogadhat hipotzishez
konvergljunk. Ha a tanul n Boole-tulajdonsggal rendelkezik a hipotzisek megkonstrulshoz, akkor egyb
korltozsok hinyban
, gy a pldk szma O(2n). Ha a meghatrozs bal oldaln d szm
d
prediktum ll, a tanulnak O(2 ) pldra van szksge, ami O(2nd) mret redukcit jelent. Elfogult
hipotzistr, pldul konjuktv elfogultsgok esetn, a redukci mg mindig szmottev lesz, br kevsb lesz
ltvnyos.
613
Created by XMLmind XSL-FO Converter.
614
Created by XMLmind XSL-FO Converter.
Ez a rsz csak rintette a deklaratv elfogultsg (declarative bias) terlett, melynek az a clja, hogy
megrtsk, hogy az elzetes tudst hogyan kell felhasznlni a megfelel hipotzistr azonostshoz, amelyben
a korrekt cldefincit keressk. Sok krds megvlaszolatlan maradt:
Hogyan kell az algoritmust kiterjeszteni a zaj kezelsre is?
Tudunk-e folytonos rtkeket felvev vltozkat kezelni?
Hogyan lehetne felhasznlni az elzetes tuds ms tpust is, a meghatrozsokon kvl?
Hogyan lehet az algoritmusokat ltalnostani, hogy egy elsrend elmletre, s nem csupn az
attribtumalap reprezentcira vonatkozzanak ?
Az egyes krdsekre a kvetkez alfejezetben keresnk vlaszt.
megoldsa az ismeretlen Hipotzis-re nzve, feltve, hogy adottak a Httrtuds, valamint a Lersok s a
Besorolsok ltal lert pldk. Hogy ezt megvilgtsuk, tekintsk a rokonsgi relcik pldk alapjn trtn
tanulst. A megfigyelseket egy kiterjedt csaldfa kpezi, az Anyja, Apja, Hzas relcikkal, valamint a Frfi
s N tulajdonsgokkal lerva. A 8.11. feladat csaldfjt fogjuk hasznlni, amit a 19.11. bra mutat. A pldhoz
tartoz lersok az albbiak:
Apja(Flp, Kroly) Apja(Flp, Anna) ...
Anyja(Mami, Margit) Anyja(Mami, Erzsbet) ...
Hzas(Diana, Kroly) Hzas(Erzsbet, Flp) ...
Frfi(Flp) Frfi(Kroly) ...
N(Beatrix) N(Margit) ...
A Besorolsok lltsai azon mlnak, hogy milyen clfogalmat szeretnnk megtanulni. A clprediktumok olyan
fogalmak lehetnnek, mint pldul a Nagyszlje, a Sgora, illetve az se. A Nagyszlje esetn a Besorolsok
teljes halmaza 20 20 = 400
Nagyszlje(Mami, Kroly) Nagyszlje(Erzsbet, Beatrix)
Azt javasoljuk, hogy ezen a ponton az olvas ismtelten fusson vgig a 9. fejezetben bemutatott nhny fogalmon, belertve a Hornklzokat, a konjunktv norml formt, az egyestst s a rezolcit.
4
615
Created by XMLmind XSL-FO Converter.
Ilyen tpus szablyt az elbbi fejezetekben ltott, attribtumalap mechanizmusokkal megtanulni, st kifejezni
sem lehet. A szably a termszetes nyelvben kifejezve:
Az F fehrje a Ngy-heliklis fel-s-le kteg sszehajtogatsi osztlyhoz tartozik, ha egy hossz cs1 heliklist
tartalmaz a msodlagos struktra 1. s 3. kztti pozciban, valamint cs1 a msodik heliklissal szomszdos.
616
Created by XMLmind XSL-FO Converter.
Az induktv tanul program trgya egy olyan lltshalmaz Hipotzis-knt val ellltsa, amely a
vonzatknyszert kielgti. tmenetileg tegyk fel, hogy az gens nem rendelkezik httrtudssal, a Httrtuds
res. Akkor egy lehetsges megolds a Hipotzis-re a kvetkez:
Nagyszlje(x, y) [ z
[z
[z
Vegyk szre, hogy egy attribtumalap tanul algoritmus, mint pldul a DNTSI-FA-TANULS sehogy sem
fog ezzel a problmval boldogulni. Ahhoz, hogy a Nagyszlje-t attribtumknt (azaz egy unris
prediktumknt) fejezzk ki, az embereket prosval objektumknt kell tudnunk kezelni:
Nagyszlje( Mami, Kroly )
Ezek utn ott akadunk el, amikor megksreljk egy plda lerst formlisan reprezentlni. Csupn olyan
elrettent attribtumokat tudnnk hasznlni, mint az:
ErzsbetAnyjaAzElsElem( Mami, Kroly )
Fontos
A Nagyszlje-nek az ilyen attribtumokkal kifejezett defincija nem lesz ms, mint egy nagy
diszjunkci, ami az egyes konkrt esetekbl ll, s amit lehetetlen az j esetekre ltalnostani. Az
attribtumalap tanul algoritmusok kptelenek relcis prediktumokat megtanulni. Az ILP egyik
legfontosabb elnye teht az, hogy a problmk sokkal szlesebb vlasztkban alkalmazhatk,
belertve a relcis problmkat is.
Az olvas termszetesen szreveszi, hogy egy kis httrtuds segtene a Nagyszlje defincijnak
reprezentcijnl. gy pldul, ha a Httrtuds tartalmazn az albbi lltst:
Szlje(x, y) [Anyja(x, y) Apja(x, y)]
lltsra lehetne reduklni. Ez megmutatja, hogy mennyire tud a httrtuds hozzjrulni a pldk
megmagyarzshoz szksges hipotzis mretnek drasztikus cskkentshez.
Az ILP-algoritmus j prediktumokat is ltesthet, hogy a magyarz jelleg hipotzis kifejezst egyszerstse.
Az elbbi pldt tekintve, teljesen sszer egy ptprediktumot javasolni amit Szlje-nek tudnnk nevezni
, hogy a clprediktum defincijt egyszerstsk. Azok az algoritmusok, amelyek j prediktumokat tudnak
617
Created by XMLmind XSL-FO Converter.
mg a negatv pldk:
Gyrgy, Erzsbet , Harry, Zara , Kroly, Flp ,
Figyeljk meg, hogy mindegyik plda egy objektumpros, hiszen a Nagyszlje egy binris prediktum.
Egszt tekintve a csaldfban 12 pozitv s 388 negatv (a szemlyek minden ms prostsa) plda tallhat.
A FOIL program klzok egy halmazt alaktja ki, mindegyik Nagyszlje(x, y)-nal mint fejjel. A klzoknak a 12
pozitv pldt a Nagyszlje(x, y) relci pldnyostsnak kell osztlyozniuk, a tbbi 388-at viszont kizrni. A
klzok Horn-klzok, melyeket neglt literlokkal bvtnk ki, ahol a neglst mint kudarcot hasznljuk,
hasonlan a Prologhoz. Egy res test klzzal kezdnk:
Nagyszlje(x, y)
Mivel ez a vlaszts minden pldt pozitvnak sorol be, leszktsre szorul. Ez gy tehet meg, hogy egy
lpsben egy literlt adunk a bal oldalhoz. A hrom lehetsges eset:
Apja(x, y) Nagyszlje(x, y)
Szlje(x, z) Nagyszlje(x, y)
Apja(x, z) Nagyszlje(x, y)
(Vegyk szre, hogy a Szlje-t definil klzzal a httrtuds mr rendelkezik.) E hrom eset kzl az els az
sszes 12 pozitv pldt helytelenl negatvnak sorolja be, gy ezt az esetet kizrjuk. A msodik s a harmadik
az sszes pozitv pldval sszhangban van. A msodik eset azonban a negatv pldk nagyobb halmazn
pontosabban ktszer annyi pldn helytelen, mert az anykat s az apkat is megengedi. gy a vlasztsunk a
harmadik esetre esik.
Most az esetet tovbb kell szkteni, kizrva azokat az eseteket, amikor x valamilyen z szlje, de z mgsem y
szlje. Egy egyedi Szlje(z, y) literl hozzadsa a kvetkez klzt eredmnyezi:
Apja(x, z) Szlje(z, y) Nagyszlje(x, y)
amely az sszes pldt helyesen sorolja be. A FOIL kpes lesz ezt a literlt megtallni s kivlasztani, s ezzel a
tanulsi feladatot megoldja. ltalnossgban, a helyes megolds megtallsa eltt, a FOIL-nak szmos sikertelen
klz kztt kell keresnie. Ez a plda a FOIL mkdsnek egyszer illusztrcija. A teljes algoritmus vza a
19.12. brn lthat. Az algoritmus lnyegben literlrl literlra egy klzt konstrul, amg az meg nem egyezik
a pozitv pldk valamilyen rszhalmazval, s egyik negatv pldval sem egyezik. A klz ltal lefedett pozitv
pldkat ekkor a tant halmazbl elhagyjuk, s az eljrst folytatjuk, amg egyetlen pozitv plda sem marad.
618
Created by XMLmind XSL-FO Converter.
19.12. bra - A FOIL algoritmus vza, amely pldkbl elsrend Horn-klzokat tanul
meg. Az J-LITERLOK s a LITERL-MEGVLASZTSA eljrsokat a szvegben magyarzzuk
meg.
Az J-LITERLOK egy klzt kap bementknt, s minden lehetsges hasznos literlt konstrul, amit a klzhoz
hozz lehetne adni. Vegyk pldul az albbi klzt:
Apja(x, z) Nagyszlje(x, y)
619
Created by XMLmind XSL-FO Converter.
3. Aritmetikai sszehasonltsok: folytonos vltozj fggvnyek tanulsnl clszer lehet az olyan literlok
hozzadsa, mint az x > y s az y z. A dntsi fa tanulshoz hasonlan egy konstans kszbrtket is lehet
hasznlni, ami a teszt diszkrimincis erejt maximalizlja.
Mindez a keressi trben nagyon nagy elgazsi tnyezhz vezet (lsd 19.6. feladat), azonban a Foil
implementciiban a tpusinformcit is fel lehet hasznlni a hipotzistr leszktsre. Az embereket s a
szmokat tartalmaz trgytartomnyban pldul a tpusleszkts nem engedn, hogy az J-LITERLOK olyan
literlokat generljon, mint a Szlje(x, n), ahol x egy ember, n viszont egy szm.
A LITERL-MEGVLASZTSA az informcinyeresgre (lsd 3.4. szakasz - Attribtumteszt-vlaszts rsz)
valamilyen mrtkben hasonl heurisztikt hasznl, hogy eldntse, melyik literlt adja hozz a klzhoz. A
rszletek itt nem klnsen fontosak, radsul szmos kiprblt vltozat is ltezik. A Foil egyik rdekes
jrulkos tulajdonsga az Ockham borotvja elvnek az alkalmazsa bizonyos hipotzisek eliminlsra. Ha
(egy bizonyos mrtk szerint) egy klz hosszabbnak mutatkozik, mint az ltala megmagyarzott pozitv pldk
sszhossza, akkor ezt a klzt a tovbbiakban nem tekintjk lehetsges hipotzisnek. Ezzel a technikval
elkerlhetjk az adatokban tallhat zajra illeszked, tlsgosan bonyolult klzok szrmaztatst. A zaj s a
klzhossz kapcsolatnak magyarzatt lsd a 1. szakasz - Statisztikai tanuls rszben.
A FOIL-t s trsait szmos definci megtanulsra vetettk be. Az egyik leghatsosabb demonstrci (Quinlan
s Cameron-Jones, 1993) a listakezel fggvnyekre vonatkoz feladatok hossz sornak a megoldsa volt
Bratko Prolog-tanknyvbl (Bratko, 1986). A program mindegyik esetben kpes volt a fggvny helyes
defincijt kisszm plda alapjn megtanulni, mikzben httrtudsknt hasznlta a korbban megoldott
fggvnyeket.
19.13. bra - Az inverz rezolcis eljrs kezd lpsei. Az rnykolt klzokat az inverz
rezolcis eljrs generlja a jobb oldalon s az alatta lv klzokbl. A nem rnykolt
klzok a Lersok-bl s a Besorolsok-bl szrmaznak.
620
Created by XMLmind XSL-FO Converter.
A 19.13. bra inverz rezolcis eljrs kezd lpseit mutatja, ahol a figyelem kzppontjban a
Nagyszlje(Gyrgy, Anna) pozitv plda ll. Az eljrs a bizonyts vgn kezd (amit az bra aljn
brzolunk). A C rezolvensnek res klzt (azaz egy ellentmondst) vlasztunk, C2-nek pedig a
Nagyszlje(Gyrgy, Anna)-t, amely a clplda neglsa. Az els inverz lps C-bl s C2-bl C1-nek a
Nagyszlje(Gyrgy, Anna)-t generlja. A kvetkez lps e klzt C-nek veszi, a Szlje(Erzsbet, Anna) klzt
pedig C2-nek, s az albbi C1 klzt generlja:
Szlje(Erzsbet, y) Nagyszlje(Gyrgy, y)
Az utols lps ezt a klzt rezolvensknt kezeli. A Szlje(Gyrgy, Erzsbet) klzt C2-nek vve, egy lehetsges
C1 klz az albbi hipotzis lehet:
Szlje(x, z) Szlje(z, y) Nagyszlje(x, y)
Egy rezolcis bizonytsunk van teht arra, hogy a hipotzis, a lersok s a httrtuds maga utn vonzza a
Nagyszlje(Gyrgy, Anna) osztlyozst.
Vilgos, hogy az inverz rezolci keresst tartalmaz. Minden egyes inverz rezolcis lps
nemdeterminisztikus, hiszen az adott C s C1-hez tbb, st vgtelen sok olyan C2 klz lehet, amely kielgti azt a
felttelt, miszerint C1-gyel rezolvlva C-t ad eredmnyl. gy a 19.13. bra utols lpsben a
Szlje(Erzsbet, y) Nagyszlje(Gyrgy, y) megvlasztsa helyett az inverz rezolcis lps a kvetkez
lltsokat is tudn generlni:
Szlje(Erzsbet, Anna) Nagyszlje(Gyrgy, Anna)
Szlje(z, Anna) Nagyszlje(Gyrgy, Anna)
Szlje(z, y) Nagyszlje(Gyrgy, y)
(Lsd a 19.4. s a 19.5. feladatot.) Az egyes lpsekben rszt vev klzokat meg lehet vlasztani a Httrtudsbl, a plda Lersok-bl, a neglt Besorolsok-bl vagy az inverz rezolcis fban eddig mr legenerlt
hipotzisklzokbl. A nagyszm lehetsg, egyb kontroll nlkl, nagy elgazsi tnyezt (s gy kevss
hatkony keresst) jelent. A keress kzben tartsra tbb megkzeltst probltak ki az implementlt ILPrendszerekben:
1. A redundns vlasztsok eliminlhatk pldul a legspecifikusabb lehetsges hipotzisek generlsval,
valamint megkvetelve, hogy a hipotzisklzok mind konzisztensek legyenek egymssal s a
megfigyelsekkel. Az utols kritrium kizrn az elbbiekben megadott Szlje(z, y)
Nagyszlje(Gyrgy, y) klzt.
2. A bizonytsi stratgia szintn megszorthat. A 9. fejezetben lttuk pldul, hogy a lineris rezolci
(linear resolution) egy teljes, megszortott stratgia, amely lehetv teszi, hogy a bizonytsi fknak csak
lineris elgazsi struktrja lehessen (mint a 19.13. brn).
3. A reprezentcis nyelv is megszorthat, a fggvnyszimblumok eliminlsval s csak Horn-klzokat
megengedve. A PROGOL pldul Horn-klzokkal dolgozik, inverz vonzatrelcit (inverse entailment)
alkalmazva. Az tlet a
Httrtuds Hipotzis Lersok Besorolsok
vonzatknyszer megvltoztatsa a
Httrtuds Lersok Besorolsok Hipotzisek
Az ILP-rendszerek egyelre Galilei- vagy Joule-szint felfedezseket nem tettek, a felfedezseit azonban
tudomnyos irodalomban val publiklsra rdemesnek talltk. gy pldul Journal of Molecular Biology-ban
Turcotte rja le a fehrje sszehajtogatsi szablyok automatikus felfedezst a PROGOL ILP programmal
(Turcotte s trsai, 2001). A Progol ltal felfedezett szablyok kzl sokat az ismert elvekbl ugyan le lehetett
volna kvetkeztetni, a tbbsgt azonban a standard biolgiai adatbzisok rszeknt korbban mgsem
publikltk (lsd 19.10. bra pldja). Egy ehhez kapcsold kutats rszeknt Srinivasan (Srinivasan s trsai,
1994) molekula-struktraalap szablyok felfedezsvel foglalkozott nitroaromatikus komponensek
mutagenicitsra. Ilyen komponensek a gpkocsik ltal kibocstott kipufoggzban tallhatk. A standard
622
Created by XMLmind XSL-FO Converter.
6. sszefoglals
Ebben a fejezetben klnbz mdszereket vizsgltunk meg arra vonatkozan, hogy az elzetes tuds hogyan
segtheti az genst abban, hogy j tapasztalatokbl tanuljon. Mivel az elzetes tuds zme inkbb a relcis
modellekkel, s nem attribtumalap modellekkel van megadva, a relcis modellekbl tanul rendszerekkel is
foglalkoztunk. Az albbiakban sszefoglaljuk a fontos tudnivalkat.
Az elzetes tuds felhasznlsa a tanulsnl a kumulatv tanulshoz (cumulative learning) vezet, ahol az
gens az j tuds beszerzsvel javtja a tanulsi kpessgt.
Az elzetes tuds segt a tanulsban, mert a klnben konzisztens hipotziseket eliminlja, s a pldk
magyarzatnak kitltsvel rvidebb hipotzisekhez vezet. Ezek a tulajdonsgok javtjk a tanuls mintas szmtsi komplexitst.
Az elzetes tuds ltal betlttt klnbz vonzatknyszerek (entailment constraints) formjban
kifejezett logikai szerepeknek a megrtse segt a klnfle tanulsi mdszerek definilsban.
A magyarzatalap tanuls (MAT) (explanation-based learning, EBL) az egyedi pldkbl gy emeli ki
az ltalnos szablyokat, hogy a pldkat elszr megmagyarzza, majd a magyarzatot ltalnostja. Ezzel a
deduktv mdszerrel az elsdleges tudst hasznos, hatkony, specilis rendeltets szaktudss vltoztatjuk.
A relevanciaalap tanuls (RAT) (relevance-based learning, RBL) az elzetes tudst meghatrozsok
formjban hasznlja a relevns attribtumok azonostsra. Ily mdon egy reduklt hipotzisteret generl, s
a tanulsi folyamatot meggyorstja. A RAT lehetv teszi az egyedi pldk deduktv ltalnostst is.
A tudsalap induktv tanuls (TIT) (knowledge-based inductive learning, KBIL) induktv hipotziseket
keres, amelyek a httrtuds segtsgvel megmagyarzzk a megfigyelsek halmazt.
Az induktv logikai programozsi (ILP) (inductive logic programming) technikk a TIT-hez
folyamodnak, az elsrend logikban kifejezett httrtudst felhasznlva. Az ILP-mdszerek olyan relcis
tuds megtanulsra is alkalmasak, amelyet az attribtumalap rendszerekben nem lehet kifejezni.
Az ILP fellrl lefel megkzeltssel, a nagyon ltalnos szablyok finomtsval, vagy pedig lentrl felfel
megkzeltssel, a deduktv folyamat invertlsval valsthat meg.
Az ILP-mdszerek termszetes mdon generlnak j prediktumokat is, amelyekkel j elmletek tmren
kifejezhetk, s ltalnos cl tudomnyos elmletforml rendszerekknt is gretesnek mutatkoznak.
altmasztjk, hogy a smaragdok zlkek, negatv pldk nlkl, mgis hezitlnnk a szablyt elfogadni. A
jelensg csakis az indukcis folyamat szempontjbl relevns a priori tuds szerepvel magyarzhat. Goodman
a hasznosthat a priori tuds teljes vlasztkt javasolja, a meghatrozsok tlzott hipotzisnek
(overhypothesis) nevezett vltozatt is belertve. Sajnos a gpi tanulssal foglalkoz korai kutatsnl Goodman
munkjra nem figyeltek fel.
A MAT gykerei a tervksztsnl hasznlt STRIPS mdszereihez nylnak vissza (Fikes s trsai, 1972). Egy
terv elksztsvel a terv egy ltalnostott vltozatt a tervek knyvtrban troltk, s ksbb
makropertorknt (macro-operator) a tervksztsnl felhasznltk. Hasonl tletek Anderson ACT *
architektrjban is megjelentek, tudskompills (knowledge compilation) cmen (Anderson, 1983) s SOAR
architektrjban tudsdarabols (chunking) cmen (Laird s trsai, 1986). A smabeszerzs (schema
acquisition) (DeJong, 1981), az analitikus ltalnosts (analytical generalization) (Mitchell, 1982) s a
knyszeralap ltalnosts (constraint-based generalization) (Minton, 1984) a MAT tanuls irnyban
jelentkez s a (Mitchell s trsai, 1986; DeJong s Mooney, 1986) publikcik stimullta gyorsan nvekv
rdekldsnek kzvetlen elfutrai voltak. A szvegben bemutatott MAT algoritmust Hirsh (Hirsh, 1987)
vezette be, aki azt is megmutatta, hogy az algoritmust hogyan kell egy logikai programozsi rendszerbe gyazni.
Van Harmelen s Bundy a MAT-ot a programelemz rendszerekben (Jones s trsai, 1993) hasznlt rszleges
kirtkel (partial evaluation) mdszer varinsaknt magyarzzk (Van Harmelen s Bundy, 1988).
Az utbbi idben a szigor elemzs s a ksrleti kutats a MAT jobb megrtshez vezetett a
problmamegolds sebessgben mrt lehetsges kltsgeinek s elnyeinek tern. Minton azt mutatta meg,
hogy hacsak tekintlyes munkt nem fektetnk bele, a MAT a programot lnyegesen lelassthatja (Minton,
1988). Tambe hasonl problmkkal kszkdtt a tudsdarabolsnl, s a szablynyelv kifejezerejnek a
mrsklst javasolta, hogy a szablyok munkamemrihoz val illesztsnek jelents kltsgt minimlizljuk
(Tambe s trsai, 1990). Ers a prhuzam ezen kutats s az elsrend logika leszktett vltozatnak
kvetkeztetsi komplexitsra vonatkoz jelenlegi eredmnyei kztt (lsd 9. fejezet). A MAT vrhat
nyeresgnek formlis valsznsgi elemzse a (Greiner, 1989; Subramanian s Feldman, 1990) munkkban
tallhat. Egy kivl ttekints Dietterichtl szrmazik (Dietterich, 1990).
Ahelyett hogy a pldkat mint az ltalnosts fkuszpontjait tekintennk, j problmk megoldsra
kzvetlenl felhasznlhatk az analgis kvetkeztets (analogical reasoning) elnevezs megkzeltsben.
Az ilyen kvetkeztetsnek tbb vltozata is ltezik. Idetartozik a hasonlsg mrtkn alapul plauzbilis
kvetkeztets (Gentner, 1983) s a meghatrozsokon alapul deduktv kvetkeztets (Davies s Russell, 1987),
amely azonban megkvnja a plda jelenltt ahhoz, hogy a belle kialaktott lusta MAT a rgi plda
ltalnostst az j problma szksgletei szerint irnytsa. Az analgis kvetkeztetsnek ezt az utbbi
formjt ltalban meg lehet tallni az esetalap kvetkeztetsnl (case-based reasoning) (Kolodner, 1993) s
a szrmaztatsi analginl (derivational analogy) (Veloso s Carbonell, 1993).
A relevns informcival funkcionlis fggsgek formjban elszr az adatbzis-kutatsnl foglalkoztak, ahol
ez a nagy attribtumhalmazok kezelhet rszhalmazokra val strukturlsnak eszkze volt. Funkcionlis
fggsgeket analgis kvetkeztetsre Carbonell s Collins, majd logikai sznezettel Bobrow s Raphael
hasznltak (Carbonell s Collins, 1973; Bobrow s Raphael, 1974). Davies s Russell (Davies, 1985; Davies s
Russell, 1987) a fggsgeket msoktl fggetlenl jra felfedeztk, s az analgis kvetkeztets
szempontjbl teljes kr logikai elemzsnek vetettk al. A fggsgeket deklaratv elfogultsg cljbl
Russell s Grosof hasznltk (Russell s Grosof, 1987). A meghatrozsok s a leszktett sztrral rendelkez
hipotzistr kztti ekvivalencit Russell (Russell, 1988) bizonytotta be. A meghatrozsokat tanul
algoritmust s az RADFT megnvelt hatkonysgt elszr a FOCUS algoritmusban mutattk be (Almuallim s
Dietterich, 1991). Tadepalli a meghatrozsok tanulsra egy gyes algoritmust kzlt, amely a tanulsi
sebessgben igen lnyeges javulst mutat (Tadepalli, 1993).
Az a gondolat, hogy az induktv tanuls kivitelezhet inverz dedukcival W. S. Jevonsig vezethet vissza
(Jevons, 1874), aki azt rta, hogy: Mind a formlis logika, mind a valsznsg-elmlet tanulmnyozsa arra az
llspontra juttatott engem, hogy egy olyan dolog, mint egy kln indukcis mdszer, a dedukcival
szembelltva nincs, s az indukci egyszeren a dedukci egy fordtott alkalmazsa. A szmtstudomnyi
elemzsek Gordon Plotkin figyelemre mlt PhD-disszertcijval kezddtek Edinburghban (Plotkin, 1971).
Br Plotkin szmos, a mai ILP terletn hasznlt ttelt s mdszert dolgozott ki, az indukci egyes
rszproblmira vonatkoz bizonyos eldnthetetlensgi eredmnyek elvettk a kedvt. A MIS (Shapiro, 1981)
jbl bevezette a logikai programok tanulsi problmjt, azonban ezt fleg az automatikus hibakeress
elmlethez val hozzjrulsnak tekintettk. A szablyindukci kutatsa, vagyis az olyan rendszerek, mint az
ID3 (Quinlan, 1986) s CN2 (Clark s Niblett, 1989) a FOIL-hoz vezettek (Quinlan, 1990), amely els zben
tette lehetv relcis szablyok gyakorlati indukcijt. A terletet Muggleton s Buntine pezsdtettk fel
624
Created by XMLmind XSL-FO Converter.
(Muggleton s Buntine, 1988). CIGOL programjuk az inverz rezolci nem egszen teljes vltozatt tartalmazta,
s j prediktumok generlsra is alkalmas volt.5 A prediktum felfedezsvel Wirth s ORorke is
foglalkoztak (Wirth s ORorke, 1991). A kvetkez nagyobb rendszer a GOLEM volt (Muggleton s Feng,
1990), amely a Plotkin-fle relatve legkevsb ltalnos ltalnosts tletn alapul lefed algoritmust
hasznlja. A FOIL fentrl lefel mdon, mg a CIGOL s a GOLEM lentrl felfel mdon dolgoztak. E korszak ms
rendszerei az ITOU (Rouveirol s Puget, 1989) s a CLINT (De Raedt, 1992) rendszerek voltak. jabban a
PROGOL (Muggleton, 1995) az inverz vonzatrelci egy hibrid (fentrl lefel s lentrl felfel) megkzeltst
valstotta meg, s a rendszert szmos gyakorlati problmra alkalmaztk, klnskppen a biolgiban s a
termszetes nyelvfeldolgozsban. Muggleton a PROGOL egy kiterjesztst rja le (Muggleton, 2000),
sztochasztikus logikai programok alakjban reprezentlt bizonytalansg kezelsre.
Az ILP-mdszerek formlis elemzst (Muggleton, 1991) tartalmazza, mg a (Muggleton, 1992) egy nagy
cikkgyjtemny. A mdszerek s az alkalmazsok nagy gyjtemnye a (Lavrac s Dzeroski, 1994) knyv. A
terlet trtnetrl s a jv kihvsairl jabb ttekintst ad (Page s Srinivasan, 2002). Haussler korai
komplexitsi eredmnyei azt sugalltk, hogy az elsrend lltsok tanulsa remnytelenl bonyolult (Haussler,
1989). A klzokra vonatkoz klnbz szintaktikai korltozsok jobb megrtsvel azonban pozitv
eredmnyek is megjelentek, mg a rekurzit tartalmaz klzokra is (Dzeroski s trsai, 1992). Az ILP
komplexitsi eredmnyeirl Kietz s Dzeroski, valamint Cohen s Page rtak tfog cikkeket (Kietz s
Dzeroski, 1994; Cohen s Page, 1995).
Br az ILP jelenleg a konstruktv indukci problmjnak dominl megkzeltse, nem csak ezzel
prblkoztak. Az n. felfedez rendszerek (discovery systems) clja az j koncepcik tudomnyos
felfedezsnek ltalban a koncepci definciterben trtn kzvetlen keress tjn trtn modellezse.
Doug Lenat AM (Automated Mathematician) programja (Davis s Lenat, 1982) szakrt szablyok formjban
megfogalmazott felfedez heurisztikkat hasznlt arra, hogy elemi szmelmleti koncepcik s sejtsek
keresst irnytsa. les ellenttben a matematikai kvetkeztetsre kifejlesztett rendszerekkel, az AM nlklzte
a bizonyts fogalmt, s csak sejts szinten tudott mkdni. A program jra felfedezte a Goldbach-sejtst s az
egyrtelm prmtnyezkre bontst. Az AM architektrjt ksbb az EURISKO rendszerben (Lenat, 1983)
ltalnostottk, a rendszert a sajt felfedez heurisztikkat trni kpes szablyokkal bvtve. Az EURISKO-t
ms, a matematikai felfedezstl eltr tartomnyokban is alkalmaztk, de az AM-nl kisebb sikerrel. Az AM s
az EURISKO mdszertana vitatott, lsd (Ritchie s Hanna, 1984; Lenat s Brown, 1984).
A felfedez rendszerek egy msik csoportja a vals fizikai adatokkal val munkt clozza s j trvnyek
felfedezst ksrli meg. A DALTON, a GLAUBER s a STAHL (Langley s trsai, 1987) olyan szablyalap
rendszerek, amelyek fizikai rendszerekbl szrmaz adatokban kvantitatv sszefggseket keresnek.
Mindegyik rendszer kpes volt egy tudomny trtnetbl jl ismert felfedezs jbli meghozatalra. A
probabilisztikus technikkon klnskppen az j kategrikat felfedez klaszterez algoritmusokon alapul
felfedez rendszerekkel a 20. fejezetben foglalkozunk.
6.2. Feladatok
19.1.
Mutassa ki a konjunktv norml formba val talaktsval s a rezolci alkalmazsval, hogy a 4. szakasz Tanuls relevns informci alapjn rszben tallhat s a brazilokra vonatkoz konklzi helyes.
19.2.
Az albbi meghatrozs mindegyikre rja fel a meghatrozs logikai reprezentcijt, s magyarzza meg,
hogy a meghatrozs mirt igaz (ha igaz egyltaln).
a. A postai kd meghatrozza a megyt.
b. A kls kialakts s a nvleges rtk meghatrozzk az rme tmegt.
c. Adott program esetn a bemenetek meghatrozzk a kimeneteket.
d. A klma, a tpllkozs, a fizikai gyakorlat s a metabolizmus meghatrozzk, hogy valaki fogyni vagy
slyban gyarapodni fog.
5
Az inverz rezolcis mdszer (Russell, 1986)-ben is megjelenik, a teljes algoritmust egy lbjegyzetben kzlik.
625
Created by XMLmind XSL-FO Converter.
e. A kopaszsgot (vagy annak hinyt) az anyai gon az egyik nagyszlnek a kopaszsga hatrozza meg.
19.3.
Hasznos lenne a meghatrozsoknak egy valsznsgi verzija? Javasoljon egy defincit.
19.4.
Ptolja a C1 s/vagy C2 klzok rtkt az albbi klzhalmazban, figyelembe vve, hogy C a C1 s a C2
rezolvense:
(a) C = Igaz P(A, B), C1 = P(x, y) Q(x, y), C2 = ??
(b) C = Igaz P(A, B), C1 = ??, C2 = ??
(c) C = P(x, y) P(x, f(y)), C1 = ??, C2 = ??
Ha tbb megolds is lehetsges, a klnbz eseteket kln pldkkal illusztrlja.
19.5.
Tegyk fel, hogy egy rezolcis lpst vgrehajt logikai programot runk. Legyen teht a Rezolvls(c1, c2, c)
sikeres, ha a c a c1 s a c2 rezolvlsnak az eredmnye. Rendes krlmnyek kztt a Rezolvls-t a
ttelbizonyts rszeknt fogjuk hasznlni gy, hogy meghvjuk a c rezolvens generlsra, mikzben a c1 s a c2
vltozba konkrt klzrtkeket helyettestnk be. Tegyk most fel, hogy az eljrst a behelyettestett c-vel s a
szabad c1-gyel, valamint c2-vel hvjuk meg. Megszletik-e az inverz rezolcis lps helyes eredmnye?
Szksges-e a logikai program valamilyen specilis talaktsa, hogy az inverz lps helyesen mkdjn?
19.6.
Tegyk fel, hogy a FOIL program egy klzhoz egy literlt gy add hozz, hogy egy binris P prediktumot
hasznl, s hogy az elbbi literlok (a klz fejrszt belertve) t klnbz vltozt tartalmaznak.
a. Hny funkcionlisan klnbz literlt lehet generlni? A kt literl funkcionlisan egybeesik, ha csupn az
ltaluk tartalmazott j vltozk neveiben klnbznek.
b. Meg tudna adni ltalnos kpletet a klnbz, r argumentummal rendelkez prediktumot hasznl literlok
szmnak meghatrozsra, ha elzleg n vltozt hasznltunk?
c. A FOIL mirt nem enged olyan literlokat hasznlni, amelyek az elzleg hasznlt vltozkat nem
tartalmazzk?
19.7.
A 19.11. brn lthat csaldfa adatainak vagy annak rszhalmaznak felhasznlsval alkalmazza az se
prediktum megtanulsra a FOIL algoritmust.
626
Created by XMLmind XSL-FO Converter.
1. Statisztikai tanuls
Az ebben a fejezetben hasznlt alapvet koncepcik ismt az adat (data) s a hipotzis (hypothesis), ppgy,
mint ahogy a 18. fejezetben volt. Itt az adatok a tnyek (evidence) ezek a terletet ler valsznsgi
vltozk egy rsznek vagy mindegyiknek egy konkrt megvalsulst jelentik. A hipotzis valamilyen
valsznsgi elmlet arrl, hogy a vilg adott terlete hogyan is mkdik, ennek specilis esetei a logikai
elmlettel lert terletek.
Vegynk egy nagyon egyszer pldt. Kedvenc meglepets cukorknk ktfle, meggy- (nyam-nyam) s
citrom- (brrrr) zben kaphat. A cukorkagyrtnak sajtos humora van, s mindegyik cukorkt ztl
fggetlenl ugyanolyan tltszatlan paprba csomagolja. Az dessget nagyon nagy zskokban ruljk,
amelyekbl tfle van kvlrl megint csak megklnbztethetetlenek egymstl:
h1: 100% meggy
h2: 75% meggy + 25% citrom
h3: 50% meggy + 50% citrom
h4: 25% meggy + 75% citrom
h5: 100% citrom
Egy adott j zsk cukorka esetn a H (hipotzist jell) vletlen vltoz a zsk tpust jelenti, lehetsges rtkei
h1-tl h5-ig terjednek. Termszetesen H kzvetlenl nem figyelhet meg. Ahogy a cukorkkat felbontjuk s
megvizsgljuk, adatokat gyjtnk amelyeket D1, D2, , DN jell. Mindegyik Di egy olyan vletlen vltoz,
amelynek lehetsges rtkei a meggy, illetve a citrom. Az gens feladata, hogy jslst adjon a kvetkez
cukorka zre.1 Ez a nyilvnvalan trivilis feladat rdekes mdon mgis j betekintst nyjt a legfontosabb
problmk kzl tbbre is. Az gensnek valban elmletet kell alkotnia a vilgrl, br csak nagyon egyszert.
A Bayes-tanuls (Bayesian learning) sorn egyszeren kiszmtjuk minden egyes hipotzis valsznsgt az
adatokra tmaszkodva, majd ennek alapjn adunk predikcit. Azaz nem egyetlen legjobb hipotzist
hasznlunk a predikcihoz, hanem az szszes hipotzist hasznljuk, valsznsgkkel slyozva ket.
A statisztikban jrtasabb olvas felismeri, hogy ez a plda valjban az urna s goly (urn and ball) feladat vltozata. gy talltuk, hogy
az urna s a goly kevesebb kihvst jelent, mint a cukorka, tovbb a cukorka plda elvezet egy msik feladathoz elcserljk-e a zacskt
egy bartunkkal, vagy sem (lsd 20.3. feladat).
1
627
Created by XMLmind XSL-FO Converter.
Reprezentlja D az sszes adatot, legyen d a megfigyelt rtkek vektora, ekkor az egyes hipotzisek
valsznsgt a Bayes-szabllyal adhatjuk meg:
P(hi|d) = P(d|hi)P(hi) (20.1)
Tegyk fel, hogy egy ismeretlen X mennyisgre vonatkoz predikci a clunk. Ebben az esetben:
ahol azt feltteleztk, hogy az sszes hipotzis meghatroz X-re valamilyen eloszlst. Ez az sszefggs azt
mutatja, hogy a predikci az egyes hipotzisekbl add predikcik slyozott sszege. Maguk a hipotzisek
tulajdonkppen a nyers adatok s a predikcik kzti kzvettk. A Bayes-megkzeltsben a P(hi) prior
hipotzisek (hypothesis prior), illetve a hipotzisek mellett fellp P(d|hi) adatvalsznsgek (likelihood) a
kulcsmennyisgek.
A cukorka pldnkban azt felttelezzk, hogy a h1,, h5 a priori valsznsgei megfelelnek a gyrt
reklmjban kzlt 0,1, 0,2, 0,4, 0,2, 0,1 rtkeknek. Az adatok valsznsgt e.f.e (angol rvidtse: i.i.d.)
felttelezssel szmtjuk azaz egyforma s fggetlen eloszlst (independently and identically distributed)
tesznk fel, gy:
Tegyk fel pldul, hogy a cukorks zsk valjban csupa citromtpus (h5), s az els 10 kibontott cukorka
mind citromz, ekkor P(d|h3) = 0,510, mivel a h3 tpus zskokban a cukorkk fele citrom.2 A 20.1. (a) bra
mutatja, hogyan vltozik az t hipotzis a posteriori valsznsge, ahogy sorban szleljk a 10 citromz
cukorkt. Vegyk szre, hogy a valsznsgek az a priori rtkekrl indulnak, ennek megfelelen kezdetben h3
a legvalsznbb lehetsg, s ez gy is marad mg az els cukor felbontsa utn is. A msodik citromz
cukorka felbontsa utn h4 a legvalsznbb, 3 s tbb esetn h5 (a rettegett csupa citrom zsk). 10 citromz
cukorka utn mr meglehetsen biztosak vagyunk vgzetnket illeten. A 20.1. (b) bra mutatja annak a (20.2)
egyenlet alapjn jsolt valsznsgt, hogy a kvetkez cukorka citromz. Vrakozsunknak megfelelen
monoton nvekszik az 1 fel.
Fontos
Korbbiakban leszgeztk, hogy a cukorks zskok nagyon nagyok, mskpp az e.f.e. felttel nem ll fenn. Korrektebb lenne (de kevsb
higinikus) felttelezni, hogy minden vizsglat, kstols utn visszacsomagoljuk a cukorkt, s visszatesszk a zskba.
2
628
Created by XMLmind XSL-FO Converter.
Pldnk azt mutatja, hogy a Bayes-predikciban az igaz hipotzis vglis dominnss vlik. Ez
jellemz a Bayes-tanulsra. Brmilyen rgztett priorra, amely nem zrja ki a helyes megoldst, a
hamis hipotzisek a posteriori valsznsge vglis nullhoz tart. Ennek egyszeren az az oka, hogy
elhanyagolhatan kicsi annak valsznsge, hogy vgtelen ideig nem jellemz adatokat generljunk.
(Ezen a ponton rvelsnk hasonl a 18. fejezetben, a VKH-tanulsnl alkalmazottal.) Ennl is
fontosabb, hogy a Bayes-predikci optimlis, akr kicsi, akr nagy adathalmazunk van. Adott a priori
hipotziseloszls mellett brmely ms predikci ritkbban lesz helyes, mint a Bayes-predikci.
A Bayes-tanuls optimalitsnak termszetesen ra van. Mint a 18. fejezetben lttuk, a vals tanulsi
problmknl a hipotzistr rendszerint nagyon nagy vagy vgtelen. Nha a (20.2) egyenletben az sszegzs
(vagy folytonos esetben az integrls) pontos elvgzse kezelhet problmra vezet, de a legtbb esetben
kzelt vagy egyszerstett megoldsokra kell szortkoznunk.
Nagyon elterjedt approximcis mdszer a tudomnyos feladatokban rendszerint ezt alkalmazzuk , hogy
egyetlen, a legvalsznbb hipotzis alapjn vgezzk a predikcit, azaz olyan hi alapjn, amely maximlja a
P(hi|d)-t. Ezt maximum a posteriori vagy MAP hipotzisnek nevezzk. A MAP hipotzis alapjn vgzett
predikcik kzeltleg Bayes-predikcik. Ez a kzelts annyira j, amennyire j a P(X|d) P(X|hMAP kzelts.
A cukorka pldnkban hrom egyms utni citromz cukor szlelse utn hMAP = h5, gy a MAP-tanuls alapjn
a negyedik cukorra 1,0 valsznsggel citromzt jsolunk. Ez nyilvn sokkal veszlyesebb jslat, mint a
Bayes-predikci, amely 0,8valsznsg, ahogy a 20.1. brn is lthatjuk. Ahogy egyre tbb adatunk van, a
MAP s Bayes-predikcik egyre inkbb konverglnak egymshoz, mivel a MAP hipotzis alternatvi egyre
kevsb valsznv vlnak. Br pldnk ezt nem mutatja, de a MAP hipotzis ellltsa sokszor lnyegesen
egyszerbb, mint a Bayes-tanuls. Ennek oka, hogy csupn egy optimalizlsi problma megoldst ignyli,
szemben egy nagyon nagy sszegzsi (vagy integrlsi) problmval. A fejezet ksbbi rszben majd ltunk
pldkat erre.
Mind a Bayes-tanulsban, mind a MAP-tanulsban a P(hi) a priori hipotzis valsznsgek nagy szerepet
jtszanak. Lttuk a 18. fejezetben, hogy tlilleszkeds (overfitting) lphet fel, ha tlzottan nagy a hipotzistr
kifejezkpessge, vagyis tl sok olyan hipotzist tartalmaz, amely jl illeszkedik az adatokra. A Bayes- s a
MAP-tanuls nem alkalmaz valamilyen nknyes korltot a figyelembe vett hipotzisekre, inkbb az a priori
valsznsgeket hasznljk fel arra, hogy bntessk a hipotzisek komplexitst. A komplex hipotziseknek
tipikusan kisebb az a priori valsznsge rszben azrt, mert sokkal tbb komplex hipotzis van, mint
egyszer. Msrszrl a komplex hipotziseknek nagyobb kapacitsa van az adatokra val illeszkedshez.
(Extrm esetet vve egy tblzat 1,0 valsznsggel s tkletes pontossggal reproduklni tudja az adatokat.)
Ennek megfelelen az a priori valsznsgben testesl meg a hipotziskomplexits s az adatokra val
illeszkedsi kpessg kztti kompromisszum.
Fontos
Ezt a kompromisszumot a logikai esetben figyelhetjk meg legjobban, amikor is H csak
determinisztikus hipotziseket tartalmaz. Ebben az esetben P(d|hi) rtke akkor 1, ha hi konzisztens az
adatokkal, klnben 0. A (20.1) egyenlet alapjn azt ltjuk, hogy hMAP a legegyszerbb logikai hipotzis
lesz, amely konzisztens az adatokkal. Teht a maximum a posteriori tanuls Ockham borotvjnak egy
termszetes megvalsulsa.
A hipotziskomplexits s az adatokra val illeszkedsi kpessg kztti kompromisszumot j mdon vilgtja
meg, ha a (20.1) egyenlet logaritmust kpezzk. A hMAP hipotzis olyan kivlasztsa, amely maximlja a
P(d|hi)P(hi)-t ugyanaz, mint amikor minimalizljuk a kvetkez kifejezst:
log2P(d|hi) log2P(hi)
Hasznljuk fel az informcikdols s a valsznsg kztt a 18. fejezetben bevezetett kapcsolatot. Azt ltjuk,
hogy a log2P(hi) tag nem ms, mint a hi hipotzis specifiklshoz szksges bitek szma. A log2 P(d|hi)-tag
viszont azoknak a tovbbi biteknek a szma, amelyek ahhoz szksgesek, hogy az adott hipotzis
felttelezsvel specifikljuk az adatokat. (Ennek demonstrlsra mutatjuk be azt az esetet, amikor a hipotzis
pontosan megjsolja az adatokat, ilyenkor nincs szksg egyetlen bitre sem az adatok specifiklshoz. Ilyen
pldul a h5 hipotzis esete, amikor sorban rkeznek a citromz cukorkk s valban log2 1 = 0.) Ebben az
rtelemben a MAP-tanuls jellemzje, hogy maximlisan tmrti az adatokat. Ezt a feladatot sokkal
kzvetlenebbl clozza a minimlis hosszsg lers (MHL) (minimum description length, MDL) tanulsi
629
Created by XMLmind XSL-FO Converter.
mdszer, amely a valsznsgekkel val foglalkozs helyett a hipotzis mretnek s az adat kdolsnak
minimalizlsra trekszik.
Az utols egyszerstst az adja, ha a hipotzistrben egyenletes (uniform) priort feltteleznk. Ebben az
esetben a MAP-tanuls egy olyan hi vlasztsra redukldik, amely maximlja P(d|hi) -t. Ezt maximumlikelihood (ML) hipotzisnek nevezzk, s hML-lel jelljk. A maximum-likelihood tanuls nagyon elterjedt a
statisztikban. Ez egy olyan tudomny, amelynek sok kutatja nem bzik az a priori hipotzisek szubjektv
sk az egyik
hipotzist egy msikkal szemben, pldul amikor az szszes hipotzis egyformn komplex. Az ML-tanuls j
kzeltst adja a Bayes- s MAP-tanulsnak olyankor, amikor az adathalmaz nagy, hiszen az adatok vgl is
fellrjk a hipotzisek a priori eloszlst, de kis adathalmazok esetn problmk merlnek fel az
alkalmazsnl (mint ltni fogjuk).
20.2. bra - (a) Bayes-hl modell az ismeretlen arnyban citrom-, illetve meggyz
cukorkk esetre. (b) Annak a modellje, amikor a csomagolpapr szne fgg
(valsznsgi alapon) a cukorka ztl.
630
Created by XMLmind XSL-FO Converter.
A maximum-likelihood hipotzist az a rtk adja, amely maximlja ezt a kifejezst. Ugyanezt az rtket
kapjuk, ha a log likelihood fggvnyt maximljuk.
(A kifejezs logaritmust kpezve a szorzatot szummv redukltuk, amit rendszerint egyszerbb maximlni.) A
maximum-likelihood rtk megtallsa rdekben differenciljuk L-et szerint, a kapott kifejezst pedig
tegyk egyenlv nullval:
Magyarn a hML maximum-likelihood hipotzis azt lltja, hogy a zacskban a meggyz cukorkk vals arnya
megegyezik az eddig kibontott cukorkknl megfigyelt arnnyal!
gy tnik, rengeteget dolgoztunk, hogy felfedezznk egy nyilvnval eredmnyt. Valjban lefektettnk egy
standard mdszert a maximum-likelihood paramtertanulsra:
1. rjunk fel egy a paramter(ek)tl fgg kifejezst az adatok egyttes valsznsgre (rjuk fel a
likelihood fggvnyt).
2. rjuk fel minden egyes paramter szerint a log likelihood fggvny derivltjt.
3. Keressk meg azokat a paramterrtkeket, amelyek mellett a derivltak nulla rtket vesznek fel.
Fontos
A legtrkksebb lps ltalban az utols. Az elz pldnkban trivilisan megoldhat volt, de ltni
fogjuk, hogy sokszor iteratv megoldsokhoz vagy ms numerikus optimalizlsi technikkhoz kell
folyamodnunk, mint ahogy a 4. fejezetben trgyaltuk. A plda a maximum-likelihood tanuls egy
ltalnos problmjt is illusztrlja: ha az adathalmaz elg kicsi ahhoz, hogy nhny esemnyt mg nem
figyeltnk meg pldul nem talltunk mg meggyz cukorkt , akkor a maximum-likelihood
hipotzis nulla valsznsget rendel ezekhez az esemnyekhez. Szmos trkkt hasznlnak, hogy
elkerljk ezt a problmt, mint pldul minden esemny kezdeti valsznsgt 1-re lltjk nulla
helyett.
631
Created by XMLmind XSL-FO Converter.
Nzznk egy msik pldt. Tegyk fel, hogy a cukorka gyrtja nmi informcit akar adni a fogyasztnak,
ezrt piros s zld csomagolpaprt hasznl. A Csomagol mindegyik cukorkhoz vletlenszeren kerl
kivlasztsra, valamilyen ismeretlen az ztl fgg feltteles valsznsg-eloszls szerint. Az ehhez tartoz
valsznsgi modellt a 20.2. (b) bra mutatja. Vegyk szre, hogy hrom paramtere van: , 1 s 2. Ezekkel a
parmterekkel a Bayes-hlk standard szemantikjt hasznlva megadhat annak a valsznsge, hogy
mondjuk egy meggyz cukorkt tallunk egy zld csomagolban (2.1. szakasz - Az egyttes valsznsgeloszls fggvny lersa rsz):
A logaritmuskpzs elnye nyilvnval: a log likelihood fggvny hrom tag sszege, ahol mindegyik tag
csupn egyetlen paramtert tartalmaz. Amikor sorban mindegyik paramter szerint vesszk az sszefggs
derivltjt, majd nullv tesszk a derivltakat, hrom fggetlen egyenlethez jutunk, s mindegyik csupn
egyetlen paramtert tartalmaz:
A -ra kapott megolds ugyanaz, mint az elbb. A 1-re kapott megolds, teht annak valsznsge, hogy egy
meggyz cukorka piros paprba csomagolt, nem ms, mint a megfigyelt meggyz cukorka piros papr arny,
hasonl a helyzet 2-vel.
Fontos
Ezek az eredmnyek nagyon knyelmesek, s knnyen belthat, hogy kiterjeszthetk brmely Bayeshlra, amelynek feltteles valsznsgeit tblzatokkal adjuk meg. A legfontosabb eredmny a
kvetkez: teljes adatok esetn a Bayes-hl paramtertanulsi problmja elklnl tanulsi
problmkra dekomponlhat, egy-egy problma egy-egy paramterre.3 A msodik eredmny, hogy az
egyes paramterek adott szl melletti rtkei ppen a szlrtkek mellett megfigyelt gyakorisgokkal
egyeznek meg. ppgy, mint az elz helyzetben, itt is vatosnak kell lennnk, hogy kis adathalmazok
esetn el tudjuk kerlni a nulla rtkeket.
Nem tblzatos formra lsd a 20.7. feladatot, amelyben mindegyik paramter hatssal van szmos feltteles valsznsgre.
632
Created by XMLmind XSL-FO Converter.
A maximum-likelihood paramtereket pontosan gy kapjuk meg, mint a 20.2. (b) bra esetn. Ha a modellt ezen
az ton megtantottuk, akkor felhasznlhat arra, hogy olyan j pldkat osztlyozzon, amelyekre a C
osztlyvltoz nem ismert. A megfigyelt x1, ..., xn attribtumrtkek mellett az egyes osztlyok valsznsgt a
kvetkez sszefggs adja:
20.3. bra - A 18. fejezet tterem problmjra alkalmazott naiv Bayes-tanuls tanulsi
grbje. A dntsi fa tanuls tanulsi grbjt sszehasonlts cljbl brzoltuk.
Fontos
Ha a legvalsznbb osztlyt vlasztjuk, determinisztikus predikci adhat. A 20.3. bra mutatja a
mdszer tanulsi grbjt, ha a 18. fejezet tterem problmjra alkalmazzuk. A mdszer elg jl tanul,
de nem olyan jl, mint egy dntsi fa tanuls. Ennek oka valsznleg az, hogy a helyes hipotzis ami
egy dntsi fa nem reprezentlhat pontosan naiv Bayes-modellel. A naiv Bayes-tanuls sok
alkalmazsi terleten meglepen jl teljest, a fokozott teljestmny, turb vltozata (boosted version)
egyike a leghatkonyabb ltalnos cl tanul algoritmusoknak (lsd 20.5. feladat). A mdszer nagyon
nagy mret problmkhoz is jl alkalmazhat, n logikai vltoz esetn is csak 2n + 1 paramtere lesz,
s ahhoz, hogy a naiv Bayes-tanuls meghatrozza hML-t, nincs szksg keressre. Vgl a naiv Bayestanulsnak nem jelentenek gondot a zajos adatok, tovbb ha szksges, akkor kpes valsznsgi
predikcikat is adni.
A modell paramterei a tlag s a szrs. (Vegyk szre, hogy a normalizl konstans is fgg -tl, ezrt
nem hanyagolhatjuk el.) Legyenek a megfigyelt rtkek x1,..., xN. Ekkor a log likelihood:
Teht az tlag maximum-likelihood becslse a mintatlag, a szrs maximum-likelihood becslse pedig a minta
tlagos szrsngyzetnek ngyzetgyke. Ezek ismt kedvez eredmnyek, mivel megerstik a jzan sszel
kvetett gyakorlatot.
Vizsgljunk most egy lineris Gauss-modellt, amelyben egy X folytonos szl s Y folytonos gyermek van.
Mint az 3.1. szakasz - Bayes-hlk folytonos vltozkkal rszben megmutattuk, Y Gauss-eloszls, tlaga
linerisan fgg X-tl, mg variancija rgztett. A P(X|Y) feltteles eloszls tanulshoz maximalizlhatjuk a
feltteles likelihood fggvnyt:
634
Created by XMLmind XSL-FO Converter.
Itt a paramterek 1, 2 s . Mint a 20.4. brn szemlltettk, az (xj, yj) prok gyjtemnye adja az adatokat. A
szoksos mdszereket hasznlva (lsd 20.6. feladat) megkaphatjuk a paramterek maximum-likelihood rtkeit.
Itt most egy msik dolgot akarunk megmutatni. Vegyk csupn a 1 s 2 paramtereket, amelyek az x s y kzti
lineris sszefggst definiljk! Nyilvnval, hogy a log likelihood ezen paramterekkel trtn
maximalizlsa azonos azzal, mintha a (20.5) kifejezsben a kitev szmlljt minimalizlnnk:
Az (yj (1xj + 2)) mennyisg valjban az (xj, yj) hibja (error) azaz a tnyleges yj rtk s a becslt rtk
klnbsge. gy E nem ms, mint a jl ismert hibangyzetek sszege (sum of squared errors). Ezt a standard
lineris regresszi (linear regression) minimalizlja. Most megrthetjk, hogy mirt: a hibangyzetek
sszegnek minimalizlsa nem ms, mint a maximum-likelihood lineris (egyenessel brzolhat) modell
megadsa, feltve, hogy az adatokat rgztett variancij Gauss-zaj mellett generltuk.
2.4. Bayes-paramtertanuls
A maximum-likelihood tanuls alkalmat ad nhny nagyon egyszer eljrs ltrehozsra, de kis adathalmazok
esetn slyos hinyossgokat mutat. Pldul egyetlen meggyz cukorka szlelse utn az a maximumlikelihood hipotzis, hogy a csomag 100%-a meggytpus (azaz = 1,0). Ha nincs olyan hipotzis prior, hogy a
csomagok mind vagy csupa meggy-, vagy csupa citromtpusak, akkor ez nem jzan kvetkeztets. A Bayesmegkzelts paramtertanuls egy hipotzis priort llt fel a lehetsges paramterrtkekre, s ahogy az adatok
rkeznek, gy frissti az eloszlst.
A 20.2. (a) cukorka pldnak egyetlen paramtere van; annak valsznsge, hogy egy vletlenszeren
kivlasztott cukorka meggyz. Bayes-megkzeltsben a valsznsgi vltoz (ismeretlen) rtke, a
hipotzis prior pedig nem ms, mint a P() a priori eloszls. gy P( = ) annak a priori valsznsge, hogy a
csomag arnyban tartalmaz meggyz cukrokat.
Ha a tetszleges rtket felvehet 0 s 1 kztt, akkor a P()-nek egy folytonos eloszlsnak kell lennie, amely
csak 0 s 1 kztt nem nulla rtk, s integrlja 1. Egy lehetsges jellt az egyenletes eloszls P() = U[0, 1]
(). (Lsd 13. fejezet.) Az egyenletes eloszls a bta-eloszlsok (beta distributions) csaldjnak tagja. Minden
egyes bta-eloszls kt hiperparamterrel4 (hyperparameter) a-val s b-vel definilhat a kvetkez
egyenlet szerint:
bta[a,b] () = a1 (1)b1 (20.6)
A (20.6) megadja -ra a [0, 1] tartomnyban a srsgfggvny rtkt. Az norml konstans a-tl s b-tl
fgg. (Lsd 20.8. feladat.) A 20.5. brn bemutatjuk, hogy hogyan nz ki az eloszls klnbz a-k s b-k
esetn. Az eloszls tlaga a/(a + b), teht nagyobb a rtkek arra utalnak, hogy -t 1-hez kzelebb hisszk,
4
Azrt hvjuk hiperparamtereknek, mert eloszlsnak paramtereirl van sz, ahol maga is egy paramter.
635
Created by XMLmind XSL-FO Converter.
mint 0-hoz. Az a + b nagyobb rtkei az eloszlst cscsosabb teszik, ami a rtke felli nagyobb
bizonyossgunkat jelenti. Lthat, hogy a bta-csald a hipotzis prior lehetsgek hasznos vlasztkt nyjtja.
Rugalmassgn tl a bta-csaldnak van mg egy csodlatos tulajdonsga: ha a priorja bta[a, b], akkor egy
adatpont megfigyelse utn a posteriori eloszlsa is bta-eloszls. A bta-csaldot a logikai vltozk eloszlsa
konjuglt priorjnak (conjugate prior) nevezzk.5 Lssuk, hogyan is mkdik ez. Tegyk fel, hogy
megfigyeltnk egy meggyz cukrot, ekkor:
P(|D1 = meggy) = P(D1 = meggy|)P()
= ' beta[a,b]() = ' a1(1 )b1
= 'a (1 )b1 = beta[a + 1,b]()
Teht egy meggyz cukrot szlelve egyszeren inkrementljuk az a paramtert, hasonlkppen, ha egy
citromzt szlelnk, akkor inkrementljuk a b paramtert ezzel megkapjuk az a posteriori eloszlst. Ezek
szerint gy tekinthetnk a-ra s b-re, mint virtulis szmllkra (virtual counts), abban az rtelemben, hogy a
bta[a, b] prior pontosan gy viselkedik, mintha egyenletes eloszls priorral indultunk volna, s a 1
meggycukorkt s b 1 citromz cukorkt lttunk volna.
Tanulmnyozva a bta-eloszlsok sorozatt nvekv de lland arny a s b mentn, jl lthatjuk, hogyan
vltozik a paramter a posteriori eloszlsa az adatok berkezse sorn. Tegyk fel pldul, hogy a vizsglt
zacsk 75%-a meggytpus. A 20.5. (b) bra mutatja a bta[3, 1], bta[6, 2], bta[30, 10] eloszlssorozatot.
Nyilvnval, hogy az eloszls egy a vals krl elhelyezked keskeny cscs fel tart. Nagy adathalmazok
esetn a Bayes-tanuls (legalbbis ebben az esetben) ugyanahhoz az eredmnyhez konvergl, mint amit a
maximum-likelihood tanuls adott.
A 20.2. (b) brn a hlnak hrom paramtere volt: , 1 s 2, ahol 1 volt annak valsznsge, hogy piros
csomagols van egy meggycukorkn, mg 2 az, hogy egy citromz cukron van piros csomagols. A Bayes
hipotzis priornak mindhrom paramtert le kell fednie azaz P(, 1, 2)-t kell specifiklnunk. Rendszerint
paramterfggetlensget (parameter independence) tteleznk fel:
P(, 1, 2) = P()P(1)P(2)
Ezen felttelezs esetn minden egyes paramternek sajt bta-eloszlsa lehet, amelyet kln-kln
frissthetnk az adatok rkeztekor.
Tovbbi konjuglt priorok: a diszkrt tbbvltozs eloszlsok paramtereire a Dirichlet csald, a Gauss-eloszlsok paramtereire a
NormalWishart csald. Lsd Bernardo s Smith (1994).
5
636
Created by XMLmind XSL-FO Converter.
Fontos
Ezek utn az egsz Bayes-tanulsi folyamat formalizlhat egy megfelelen konstrult Bayes-hl
kvetkeztetsi problmjaknt, amint a 20.6. brn lthat. Egy j pldny predikcija egyszeren azt
jelenti, hogy j pldnyvltozkat adunk a hlhoz, amelybl egyesekre rkrdeznk. A tanuls s a
predikci ezen formalizmusa nyilvnvalv teszi, hogy a Bayes-tanulshoz nem kell semmilyen extra
tanulsi elv. Megllapthatjuk tovbb, hogy lnyegben csak egyetlen tanulsi algoritmus van, ami a
Bayes-hl kvetkeztetsi algoritmusa.
s leellenrizhetjk az adatokon, hogy ugyanez az egyenlet fennll-e a megfelel feltteles gyakorisgok kzt is.
Viszont mg akkor is, ha a struktra a terlet vals oksgi termszett rja le, az adathalmaz a statisztikai
ingadozsok miatt az egyenletet soha nem elgti ki pontosan. Ezrt megfelel statisztikai prbkat kell
elvgeznnk, hogy eldntsk: elg bizonytkunk van-e arra, hogy a fggetlensgi hipotzisek srlnek. Az
eredmnyl kapott hl bonyolultsga az ezen tesztekben alkalmazott kszbtl fgg majd minl szigorbb a
fggetlensgi teszt, annl tbb kapcsolatot adunk majd a struktrhoz, s annl nagyobb lesz a tlilleszkeds
veszlye.
A jelen fejezetben bemutatott gondolatoknak jobban megfelel megkzelts annak rtkelse, hogy a javasolt
modell mennyire magyarzza meg az adatokat (valsznsgi rtelemben). Mindamellett vatosnak kell lennnk
ennek mrsnl. Ha egyszeren a maximum-likelihood hipotzist akarjuk megtallni, akkor egy teljesen
sszekttt hlnl fogunk kiktni, mivel tovbbi szlcsompontok hozzadsa egy csomponthoz nem
cskkentheti a valsznsget (lsd 20.9. feladat). Valamilyen mdon bntetnnk kell a modell bonyolultsgt.
A MAP (vagy MLH) megkzelts egyszeren levon egy bntettagot az egyes struktrk valsznsgbl
(miutn hangolta paramtereiket), ezek utn hasonltja ssze a klnbz struktrkat. A Bayes-megkzelts a
struktrk s paramterek egyttes priorjt hasznlja. Rendszerint tl sok a vltozk szmn
szuperexponencilis struktra van ahhoz, hogy mind felett sszegezznk, gy a gyakorlatban legtbben az
MCMC (Markov lnc Monte Carlo) mdszert hasznljk, hogy mintt vegyenek a struktrkbl.
A bonyolultsg bntetse (akr MAP, akr Bayes-megkzeltsben) fontos kapcsolatot hoz be az optimlis
struktra s a feltteles valsznsgek hlbeli reprezentcis mdja kztt. Tblzatosan brzolt eloszls
esetn a bonyolultsg bntetse a szlcsompontok szmval exponencilisan n, mg, mondjuk, zajos-vagy
eloszlsok esetn csak linerisan. Ez azt jelenti, hogy a zajos-vagy (illetve ms tmren paramterezett)
modellek tanulsa tbb szlcsompontot eredmnyez, mint a tblzatos eloszls tanulsa.
638
Created by XMLmind XSL-FO Converter.
eltvoltsa az (a) hlbl a (b) hlhoz vezet; a paramterek szma 78-rl 708-ra n. Teht a rejtett
vltozk drmaian cskkenthetik a Bayes-hl megadshoz szksges paramterek szmt. Ez viszont
drmaian cskkentheti a paramterek megtanulshoz szksges adatok mennyisgt.
A rejtett vltozk fontosak, de bonyoltjk a tanulsi problmt. A 20.7. (a) brn pldul nem vilgos, hogy
adott szlcsompontok esetn hogyan tanulhat meg a SzvBetegsg feltteles eloszlsa, mivel nem ismert az
rtke az egyes esetekben. Ugyanez a problma fellp a tnetek eloszlsnak tanulsnl is. Ebben a rszben
egy olyan expectationmaximization,7 EM nev algoritmust ismertetnk, amely nagyon ltalnos
megoldst ad erre a problmra. Hrom pldt mutatunk be, majd ltalnos lerst adunk. Ez az algoritmus
elszr holmi mginak tnik, de amint a mgttes intucit megrtettk, a tanulsi problmk hatalmas
terletn egy sor helyen alkalmazhatjuk.
639
Created by XMLmind XSL-FO Converter.
sszefggs rja le, ahol x jelenti az adatpont attribtumait. Folytonos adatok esetn a komponensekre
termszetesen addik a tbbvltozs Gauss-eloszls, ami az gynevezett kevert Gauss- (mixture of
Gaussians) eloszls csaldot adja. A kevert Gauss-eloszls paramterei: wi = P(C = i) (az egyes komponensek
slya), i (az egyes komponensek vrhat rtke) i (az egyes komponensek kovariancija). A 20.8. (b) bra
hrom Gauss-eloszls keverkt mutatja, valjban ez volt az (a) brn lthat adathalmaz forrsa.
Ez esetben a nem ellenrztt osztlyozsi problma abban ll, hogy a 20.8. (a) brn lthat nyers adatokbl
kell visszalltani a 20.8. (b) brn lthathoz hasonl kevert modellt. Nyilvnval, hogy ha tudnnk, melyik
adatot melyik komponens generlta, akkor knny lenne visszalltanunk az egyes Gauss-komponenseket.
Egyszeren kivlaszthatnnk az egyes komponensekhez tartoz sszes adatpontot, majd alkalmazhatnnk a
(20.4) egyenletet (tulajdonkppen annak tbbvltozs verzijt) a Gauss-paramtereknek az adatokhoz val
illesztsre. Msrszrl, ha tudnnk az egyes komponensek paramtereit, akkor legalbbis valsznsgi
rtelemben meg tudnnk adni, hogy melyik adatpont melyik eloszlshoz tartozik. A problma az, hogy sem az
adatpontok komponensekhez rendelst, sem a komponensek paramtereit nem ismerjk.
20.8. bra - (a) 500 ktdimenzis adatpont, amely hrom osztly jelenltt sugallja. (b)
Egy hrom-komponens kevert Gauss-modell, a slyok (balrl jobbra) 0,2, 0,3 s 0,5.
Az (a) brn lthat adatokat ebbl a modellbl generltuk. (c) Az adatokbl az EM
algoritmussal rekonstrult modell
Az EM algoritmus alaptlete ebben az sszefggsben az, hogy gy tesznk, mintha ismernnk a modell
paramtereit, majd kiszmtjuk minden egyes pont minden egyes komponenshez val tartozsnak
valsznsgt. Ezek utn jraillesztjk a komponenseket az adatokhoz: mindegyik komponenst a teljes
adathalmazhoz illesztjk, az egyes adatpontokat az adott komponenshez tartozs valsznsgvel slyozva. Az
eljrst a konvergencia elrtig folytatjuk. Lnyegben teljess tesszk az adatokat azzal, hogy a rejtett
vltozk melyik adat melyik komponenshez tartozik valsznsgi eloszlst kikvetkeztetjk a
pillanatnyilag hasznlt modell segtsgvel. A kevert Gauss-eloszls esetn a paramtereknek tetszleges mdon
kezdeti rtket adunk, majd a kvetkez kt lpst ismteljk:
1. E-lps: Szmtsuk ki a pij = P(C = i|xj valsznsgeket, amelyek azt fejezik ki, hogy milyen valsznsggel
generlta az i-edik komponens xj-t. A Bayes-szably alapjn pij = P(xj|C = i) P(C = i). A P(xj|C = i) tnyez
az xj valsznsge az i-edik Gauss-eloszlsban, mg P(C = i) az i-edik Gauss-eloszls slya. Hasznljuk a
defincit.
2. M-lps: Szmtsuk ki az j tlag, szrs s komponens sly paramtereket a kvetkezk szerint:
640
Created by XMLmind XSL-FO Converter.
Az E-lps vagy expectation (vrhatrtk-kpzs) lps gy foghat fel, mintha a rejtett indiktor vltoz
(indicator variable) Zij valsznsgnek pij vrhat rtkt (expected value) szmtannk ki. Ha az i-edik
komponens generlta xj-t, akkor Zij rtke 1, klnben pedig 0. Az M-lps vagy maximization
(maximumkeress) lps a rejtett vltozk adott vrhat rtke mellett megkeresi azokat a paramtereket,
amelyek maximljk az adatokra fellltott log likelihood fggvnyt.
Fontos
A vgs modellt amelyet az EM segtsgvel a 20.8. (a) bra adatain tanultunk a 20.8. (c) bra
mutatja. Ltszlag megklnbztethetetlen attl az eredeti modelltl, amellyel az adatokat generltuk.
A 20.9. (a) bra az adatoknak a pillanatnyi modellbl szmtott log likelihood rtkt mutatja az EM
algoritmus futsa sorn. Kt pontra hvjuk fel a figyelmet. Elszr is, a vgs modellre a log likelihood
nmileg meghaladja az arra a vals modellre szmtott rtket, amelyekkel az adatokat generltuk. Ez
meglepnek tnhet, de egyszeren azt mutatja, hogy az adatokat vletlenszeren generltuk, s nem
pontosan tkrzik a mgttes modellt. A msodik, hogy az EM minden itercis lpsben nveli az
adatok log likelihood rtkt. Ez ltalnossgban is bizonythat. Tovbb bizonyos felttelek mellett
belthat, hogy az EM biztosan elri a likelihood egy loklis maximumt. (Ritka esetekben elrhet egy
nyeregpontba, vagy akr egy loklis minimumba is.) Ebben az rtelemben az EM egy gradiensalap
hegymsz algoritmusra emlkeztet, de vegyk szre, hogy nincs lpsmret paramtere!
A dolgok nem mennek mindig olyan jl, mint ahogy a 20.9. (a) bra esetleg sugallja. Elfordulhat, hogy az
egyik Gauss-komponens gy sszezsugorodik, hogy csak egyetlen adatpontot fed le. Ebben az esetben a
variancija nullhoz tart, a belle szmtott likelihood pedig vgtelenhez! Msik problma lehet, hogy kt
komponens sszeolvad, azonos tlagot s variancit vesz fel, az adatpontokon pedig osztoznak. Az ilyen
tpus degenerlt loklis maximumok slyos problmt jelentenek, elssorban sokdimenzis terekben. Ennek a
problmnak egyik megoldsa lehet megfelel priorok lltsa a modell paramtereire s az EM algoritmus
MAP-vltozatnak alkalmazsa. Msik lehetsg a komponens jraindtsa j paramterekkel, ha tl kicsiv
vlik vagy tl kzel kerl ms komponensekhez. A paramterek sszer kezdeti rtkei szintn segtenek a
problma megoldsban.
641
Created by XMLmind XSL-FO Converter.
Vigyk vgig az EM-itercit erre a problmra. Elszr nzzk az adatokat. 1000 mintt generltunk a
kvetkez paramterekkel rendelkez (valdi) modell alapjn:
= 0,5, I1 = Cs1 = Ly1 = 0,8, I2 = Cs2 = Ly2 = 0,3 (20.7)
Azaz a cukorkk egyforma valsznsggel szrmazhatnak mindkt zskbl, az els zsk nagyobbrszt
meggyz cukrokat tartalmaz piros csomagolsban, s sok kztk a lyukas, a msodik inkbb nem lyukas
citromzeket, zld csomagolsban. A lehetsges nyolcfle cukor elfordulsi szmai a kvetkezk:
642
Created by XMLmind XSL-FO Converter.
Elszr nzzk a paramtert. A teljesen megfigyelhet esetben ezt kzvetlenl az 1. zskbl, illetve 2. zskbl
szrmaz cukorkk megfigyelt szmaibl becslnnk. Mivel a zsk rejtett vltoz, ehelyett a vrhat
szmrtkekkel szmolunk. A vrhat cukorkaszm
sszegezve, hogy a cukorka az 1. zskbl szrmazik:
(Figyeljk meg, hogy a normalizl konstans szintn a paramterektl fgg.) Alkalmazva ezt a kpletet,
mondjuk, a 273 pirosan csomagolt meggyz cukorkra, amelyekben lyuk van, a kvetkezt kapjuk:
Ezek a valsznsgek ismt brmely Bayes-hl algoritmussal kiszmthatk. Befejezve ezt az eljrst,
megkapjuk az sszes paramter j rtkt:
A gyakorlatban jobb vletlen rtkeket vlasztani, hogy elkerljk a szimmetria ltal okozott loklis maximumokat.
643
Created by XMLmind XSL-FO Converter.
Az adatok log likelihood rtke a kezdeti kb. 2044-rl az els iterci sorn kb. 2021-re n, ahogy a 20.9. (b)
brn lthat. Eszerint a frissts magt a likelihoodot kb. e23 1010 szorzfaktorral nvelte. A tizedik itercira
a megtanult modell jobban illeszkedik, mint a valdi (L = 1982,214). Ezek utn a javuls nagyon lassv vlik.
Ez nem szokatlan az EM algoritmusnl, ezrt sok gyakorlatban hasznlt rendszer a tanuls vgs fzisban
gradiensalap algoritmusokkal mint pl. a NewtonRaphson-mdszer (lsd 4. fejezet) kombinlja az EM
algoritmust.
Fontos
Az ebbl a pldbl levonhat ltalnos tanulsg az, hogy a rejtett vltozkkal trtn Bayes-hl
tanulsparamtereinek frisstse kzvetlenl rendelkezsnkre ll az egyes pldkon trtn
kvetkeztets eredmnyekppen. Radsul csak loklis a posteriori valsznsgekre van szksgnk az
egyes paramterekhez. Az ltalnos esetben, amikor az egyes Xi vltozk feltteles valsznsgi
paramtereit azaz a ijk = P(Xi = Xij|Pai = paik) rtkeket tanuljuk, adott szlcsompontok esetn, a
frisstst a normalizlt vrhat szmrtkek adjk:
A vrhat szmrtkek a pldk sszegzsvel nyerhetk, kiszmtva a P(Xi = xij, Pai = paik) valsznsgeket
egy tetszleges Bayes-hl kvetkeztetsi algoritmussal. A pontos algoritmusok esetn belertve a vltoz
elimincit is ezek a valsznsgek mind a kvetkeztets mellktermkeknt kzvetlenl nyerhetk, a
tanulshoz nincs szksg semmilyen specilis extra szmtsra. St minden egyes paramter tanulshoz
szksges informci loklisan rendelkezsre ll.
644
Created by XMLmind XSL-FO Converter.
Ismt tetszleges RMM kvetkeztetsi algoritmust hasznlhatunk a vrhat szmrtkek kiszmtsra. A 15.4.
brn bemutatott elre-htra (forward-backward) algoritmus knnyen mdosthat gy, hogy kiszmtsa a
szksges valsznsgeket. Egy fontos szempont, hogy azokra a valsznsgekre van szksgnk, amelyeket
inkbb simtssal (smoothing) nyernk, nem pedig szrssel (filtering): azaz neknk utlagosan kell
rtkelnnk a bizonytkokat az adott llapottmenet bekvetkezsi valsznsgnek becslsekor. Mint a 15.
fejezetben mondtuk, a gyilkossg bizonytkt ltalban a gyilkossg bekvetkezte (azaz az i llapotbl a j
llapotba val tmenetet) utn nyerjk.
Az EM algoritmus dihjban ez az egyenlet. Az E-lps az sszegzs kiszmtsa, ami a teljess tett adatokra,
a log likelihoodnak a P(Z = z|x, (i)) eloszls szerint szmtott vrhat rtke. Ez a valsznsg a rejtett
vltozknak az adatok felhasznlsval nyert a posteriori valsznsge. Az M-lps viszont nem ms, mint
ennek a log likelihoodnak a maximalizlsa a paramterek szerint. Kevert Gauss-jelekre a rejtett vltozk a Zij-k,
ahol Zij = 1, ha a j-edik mintt az i-edik komponens generlta. Bayes-hlknl az egyes pldk nem megfigyelt
vltoz rtkei a rejtett vltozk. RMM esetben az i j tmenetek a rejtett vltozk. Ha azonostottuk a
megfelel rejtett vltozkat az adott alkalmazsban, akkor az ltalnos formbl kiindulva levezethet az EM
algoritmus.
Amint megrtettk az ltalnos elgondolst, amin az EM alapul, az sszes varins s javts knnyen
levezethet. Pldul: sok esetben az E-lps a rejtett vltozk posteriorjainak kiszmtsa kezelhetetlen
problmt okoz, mint pldul a nagy Bayes-hlkban. Kiderlt, hogy alkalmazhatunk egy kzelt E-lpst, s
mg ezzel is hatkony algoritmust kapunk. Egy mintavteli algoritmussal mint amilyen pldul az MCMC
(lsd 14.5. alfejezet) a tanulsi folyamat nagyon szemlletes: minden egyes, az MCMC ltal bejrt llapotot (a
rejtett s megfigyelt vltozk konfigurcijt) gy kezelnk, mintha teljes megfigyels volna. Ennek
megfelelen a paramterek minden egyes MCMC-tmenet utn frissthetk. A kzelt kvetkeztets ms
formi mint pldul a varicis s hurkos mdszerek szintn hatkonynak bizonyultak nagyon nagy hlk
tanulsnl.
4. Pldnyalap tanuls
Eddigiekben a statisztikai tanuls trgyalsban arra koncentrltunk, hogy valsznsgi modellek egy
behatrolt csaldjnak paramtereit egy struktrjban nem kttt adathalmazra illesszk. Pldul a kevert
Gaussokat hasznl, nem ellenrztt tanuls felttelezi, hogy az adatok megmagyarzhatk rgztett szm
Gauss-eloszls sszegeknt. Az ilyen mdszereket paramteres tanulsnak (parametric learning) nevezzk.
A paramteres tanul eljrsok gyakran nagyon egyszerek s hatkonyak, de egy meghatrozott behatrolt
modellcsald felttelezse sokszor tlzott egyszerstse annak, ami az adatokat szolgltat vals vilgban
trtnik. Nos, az termszetesen igaz, hogy ha nagyon kevs adatunk van, akkor nem remnykedhetnk egy
bonyolult s rszletes modell megtanulsban, de butasgnak tnik a hipotzis komplexitst akkor is rgztve
tartani, amikor az adathalmaz nagyon nagyra n.
A paramteres mdszerekkel ellenttben a nemparamteres tanulsi (nonparametric learning) mdszerek
lehetv teszik, hogy a hipotzis bonyolultsga egytt nvekedjk az adatokkal. Minl tbb adatunk van, annl
krmnfontabb lehet a hipotzis. Kt, nagyon egyszer nemparamteres pldnyalap tanulst hasznl
mdszercsaldot fogunk vizsglni, amelyeket azrt neveznk gy, mert kzvetlenl a tant pldnyokbl
hoznak ltre hipotziseket.
hogy k pontot tartalmazzon, ahol k elg nagy ahhoz, hogy sszer becslst vgezhessnk. Rgztett k esetn a
szomszdsg mrete vltoz, ahol ritkn vannak az adatok, ott a szomszdsg tg trrsz, ahol az adatok srn
helyezkednek el, ott a szomszdsg szk. A 20.12. (a) bra egy pldt mutat: kt dimenziban sztszrt
adatpontokat. A 20.13. bra mutatja az ezen adatokra elvgzett k-legkzelebbi-szomszd srsgbecslst k = 3,
10 s 40 esetre. k = 3 esetben a srsgbecslst minden egyes pontban csak 3 szomszdos pontra alapozzuk,
s ezrt ersen vltoz eredmnyt kapunk. k = 10 esetn a 20.12. (b) brn lthat valdi srsg j becslst
kapjuk. k = 40 esetn a szomszdsg tl tgg vlik, s az adatok struktrjt mindenestl elvesztjk.
Gyakorlatban kis dimenziszm esetn egy 5 s 10 kz es k a legtbb esetben j eredmnyt ad.
Keresztvalidci alkalmazsval is j rtket kaphatunk a k-ra.
20.12. bra - (a) A 20.8. (a) bra adatainak 128 pontos rszhalmaza, kt kivlasztott
ponttal, s 10 legkzelebbi szomszdjukkal. (b) Az adatok ellltsnl hasznlt kevert
Gauss-eloszls 3D brja.
20.13. bra - A 20.12. (a) brn lthat adatokra vgzett srsgbecsls, k = 3 (a); k = 10
(b) s k = 40 (c) esetn
Ahhoz, hogy egy krdses pontban a legkzelebbi szomszdokat meg tudjuk hatrozni, egy tvolsgmetrikra
D(x1, x2)-re van szksgnk. A 20.12. bra ktdimenzis pldjban euklideszi tvolsgot hasznltunk. Ez
nem felel meg, ha a tr minden dimenzijban valami mst mrnk pldul magassgot s slyt , mivel egy
dimenzi skljnak megvltoztatsa megvltoztatja a legkzelebbi szomszdok halmazt. Az egyik lehetsg,
hogy minden egyes dimenzi skljt normalizljuk. Ehhez elszr megmrjk az sszes tulajdonsg
variancijt a teljes adathalmazon, majd a tulajdonsgrtket gy fejezzk ki, hogy megadjuk: a
tulajdonsgrtk az adott tulajdonsg variancijnak hnyszorosa. (Ez a Mahalanobis-tvolsg [Mahalanobis
distance] amely a tulajdonsgok kovarianciamtrixt veszi figyelembe specilis esete.) Vgl diszkrt
esetben alkalmazhatjuk a Hamming-tvolsgot (Hamming distance), amely gy definilja D(x1, x2)-t, mint
azon tulajdonsgok szmt, amelyben x1 s x2 eltr.
647
Created by XMLmind XSL-FO Converter.
A 20.13. brn lthathoz hasonl srsgbecslsek a bemeneti tr feletti egyttes eloszlsokat hatroznak meg.
A Bayes-hlktl eltren a pldnyalap reprezentcik nem tartalmaznak rejtett vltozkat, ami azt jelenti,
hogy nem alkalmazhatunk nem ellenrztt osztlyozst, mint ahogy a kevert Gauss-modellnl tettk. Tovbbra
is alkalmazhatjuk a kvnt y rtknek az x bemeneti tulajdonsgok alapjn trtn jslsra a srsgbecslst, ha
kiszmtjuk P(y|x) = P(y, x)/P(x)-et, feltve, hogy a tant adatok a kvnt rtkre nzve is tartalmaznak
rtkeket.
A legkzelebbi-szomszd tanulsi algoritmus hasznlhat kzvetlen ellenrztt tanulsra is. Ha adott egy
tesztplda x bemeneti rtkekkel, akkor az y = h(x) az x k-legkzelebbi-szomszdjnak y rtkeibl nyerhet.
Diszkrt esetben tbbsgi szavazssal kaphatunk egyetlen jsolt rtket. Folytonos esetben tlagolhatjuk a k
darab rtket, vagy loklis lineris regresszit vgezhetnk a k pontra illesztve, ez utbbi esetben a jslst a
kialakul hipersk x-beli rtke adja.
A k-legkzelebbi-szomszd tanulsi algoritmus nagyon egyszeren megvalsthat, kevs hangolst ignyel, s
gyakran elg jl mkdik. J dolog, ha elszr egy j tanulsi problmn prbljuk ki. Mindazonltal nagy
adathalmazokban hatkony mechanizmust kell tallnunk arra, hogy a krdses x pont legkzelebbi szomszdjait
megtalljuk, hiszen tl hossz lenne minden pontra kiszmtani a tvolsgot. Egy sor szellemes, a tant adatok
elfeldolgozsn alapul mdszert javasoltak ennek a lpsnek a hatkonyny ttelre. Szerencstlen mdon a
legtbb ilyen mdszer nem viselkedik jl a tr dimenzijnak nvekedsvel (azaz a tulajdonsgok szmnak
nvekedsvel).
A sokdimenzis terek mg egy tovbbi problmt jelentenek, nevezetesen azt, hogy egy ilyen trben a
legkzelebbi szomszdok rendszerint nagyon messze vannak. Vegynk egy N elem, d dimenzis
egysgkockban elhelyezked adathalmazt, s tegyk fel, hogy a szomszdsgok b oldal hiperkockk, amelyek
trfogata bd. (Ugyanez a megfontols mkdne hipergmbk felttelezse esetn is, de a hipergmb
trfogatkplete bonyolultabb.) Ahhoz, hogy k pontot tartalmazzon, az tlagos szomszdsg a teljes trfogat
amit egysgnyinek tekintnk k/N-ed rszt kell elfoglalnia. Ennek megfelelen bd = k/N, vagyis b = (k/N)1/d.
Eddig j. Legyen most d = 100, k = 10 s N = 1 000 000 rtk. Akkor b 0,89 azaz a szomszdsg majdnem
az egsz bemeneti teret elfoglalja! Ez arra utal, hogy sokdimenzis esetben a legkzelebbi-szomszd alap
mdszerek nem megbzhatk. Alacsony dimenziszm esetn nincs problma, d = 2 esetn b = 0,003.
4.2. Kernelmdszerek
A kernelmodellben (kernel model) gy tekintnk minden tant pldnyra, mintha egy kis sajt
srsgfggvnyt kernelfggvnyt (kernel function) generlna. Az ered srsgfggvny becsls nem
ms, mint a kis kernelfggvnyek slyozott sszege. Egy xi tant pldny egy K(x, xi) kernelfggvnyt generl,
amely a tr minden x pontjhoz egy valsznsget rendel. gy a srsgbecsls:
Normlis esetben a kernelfggvny csak az x s xi kztti D(x, xi) tvolsgtl fgg. A legnpszerbb
kernelfggvny (termszetesen) a Gauss-fggvny. Az egyszersg kedvrt egy gmbszimmetrikus Gaussfggvnyt feltteleznk, amelynek minden tengely mentn w a szrsa, azaz:
ahol d az x dimenziszma. Htra van mg a megfelel w rtk vlasztsnak problmja. ppgy, mint az
elzkben egy tl kis szomszdsg nagyon hepehupss teszi a becslst mint a 20.14. (a) brn lthat. A (b)
brn lthat, hogy egy kzepes w rtk nagyon j becslst ad. A (c) brn bemutattuk, hogy a tl nagy
szomszdsg eredmnyekpp teljesen elvesztjk a struktrt. J w rtket vlaszthatunk keresztvalidcival.
648
Created by XMLmind XSL-FO Converter.
Ellenrztt tanulst kernelekkel gy vgezhetnk, hogy a tant pldnyokbl szrmaztatott sszes jsls
slyozott kombincijt vesszk. (sszehasonltva a k-legkzelebbi-szomszd mdszerrel, ott a k-legkzelebbipldny slyozatlan kombincijt hasznljuk.) Az i-edik pldnynak a krdses x pontra vett slyt a K(x, xi)
kernelfggvnyrtk adja. Diszkrt jsls esetn slyozott szavazst vehetnk, folytonos esetben slyozott
tlagot vagy slyozott lineris regresszit. Figyeljk meg, hogy a kernelekkel vgzett jsls azt ignyli, hogy az
sszes tant pldnyt figyelembe kell vennnk. A kernelek sszekombinlhatk a legkzelebbi-szomszd
indexelsi smival azrt, hogy csupn a szomszdos pldnyok alapjn ellltott slyozott jslst
alkalmazzuk.
5. Neurlis hlk
A neuron egy olyan agysejt, amelynek alapfeladata elektromos jelek sszegyjtse, feldolgozsa s
sztterjesztse. A 2.4. szakasz - Neurlis tudomnyok (1861-tl napjainkig) rszben az 1.2. bra egy tipikus
neuron sematikus rajzt mutatja. Azt gondoljuk, hogy az agy informcifeldolgoz kapacitsa elssorban ilyen
neuronok hlzatbl alakul ki. Ezrt a korai MI nhny kutatsa mestersges neurlis hlk (neural
networks) ltrehozsra irnyult. (A terlet ms, szintn hasznlt elnevezsei: konnekcionizmus
[connectionism], prhuzamos elosztott feldolgozs [parallel distributed processing] s neurlis
szmtstechnika [neural computation].) A 20.15. bra a neuron egyszer matematikai modelljt mutatja,
ahogy McCulloch s Pitts (McCulloch s Pitts, 1943) megalkottk. Elnagyolva az mondhat, hogy a neuron
akkor tzel, amikor a bemeneti rtkek slyozott sszege meghalad egy kszbt. 1943 ta sokkal
rszletesebb s valsghbb modelleket alkottak mind a neuronra, mind az agy nagyobb rendszereire, ez
vezetett a szmtgpes ideghl-modellezs (computational neuroscience) modern tudomnyterletnek
megjelenshez. Msrszt az MI s a statisztika kutatinak rdekldst felkeltettk a neurlis hlzatok
absztraktabb tulajdonsgai, mint pldul az elosztott szmts elvgzsre, a bemeneti zajjal szembeni
rzketlensgre s a tanulsra val kpessg. Br ma mr tudjuk, hogy ms rendszerek, pldul a Bayes-hlk is
rendelkeznek ezekkel a tulajdonsgokkal, de a neurlis hl maradt a tanul rendszerek egyik leghatkonyabb s
legnpszerbb formja, ezrt megri kln trgyalni.
649
Created by XMLmind XSL-FO Converter.
A kimenett gy kapja, hogy ezek utn egy g aktivcis fggvnyt (activation function) alkalmaz a kapott
sszegre:
Figyeljk meg, hogy hasznltunk egy eltolsslyt (bias weight) W0,i-t, amelyet egy rgztett rtk a0 = 1
bemenetre kapcsolunk. Rvidesen megmagyarzzuk, hogy mi a jelentsge.
Az aktivcis fggvnnyel szemben kt elvrsunk van. Elszr az, hogy az egysg legyen aktv (+1 krli
kimenet), ha a helyes bemeneteket kapja, s inaktv (0 krli kimenet), ha rossz bemeneteket kap.
Msodszor az, hogy az aktivci legyen nemlineris, klnben az egsz neurlis hl egy egyszer lineris
fggvnny fajul (lsd 20.17. feladat). A 20.16. bra ktfle aktivcis fggvnyt mutat be: a kszbfggvnyt
(threshold function), illetve a szigmoid fggvnyt (sigmoid function) (mely utbbi logisztikus fggvnyknt
[logistic function] is ismert). A szigmoid fggvny elnye, hogy differencilhat, ami mint ksbb ltni
fogjuk fontos a slytanulsi algoritmus szempontjbl. Vegyk szre, hogy mindkt fggvnynek van egy
kszbpontja (akr kemny, akr lgy) a nullnl; az eltolssly lltja be az egysg aktulis kszbpontjt. Ez
azt jelenti, hogy az egysg akkor aktivldik, ha a valdi bemenetek slyozott sszege
meghaladja W0,i-t.
650
Created by XMLmind XSL-FO Converter.
Nmi fogalmunk alakulhat ki az egyes egysgek mkdsrl, ha sszehasonltjuk ket a logikai kapukkal. Az
egyes egysgek tervezsnek eredeti motivcii kztt (McCulloch s Pitts, 1943) szerepelt az, hogy kpesek az
alapvet logikai fggvnyek reprezentlsra. A 20.17. bra bemutatja, hogy az s, vagy s nem logikai
fggvnyek hogyan reprezentlhatk egy megfelel slyokkal rendelkez kszbegysg segtsgvel. Ez azrt
fontos, mert azt jelenti, hogy ezen egysgek felhasznlsval tetszleges logikai fggvny kiszmtsra tudunk
hlzatot pteni.
5.2. Hlstruktrk
A neurlis hlstruktrk kt f csoportja: a hurokmentes vagy elrecsatolt hlk (feed-forward network) s a
visszacsatolt vagy rekurrens hlk (recurrent network). Az elrecsatolt hl a pillanatnyi bemenet
fggvnyt reprezentlja, azaz nincs semmilyen ms bels llapota, csak maguk a slyok. A rekurrens hl
viszont a kimeneteit visszacsatolja a bemeneteire. Ez azt jelenti, hogy a hl aktivcis szintjei dinamikus
rendszert alkotnak, elrhetnek stabil llapotot, de mutathatnak oszcillcit, st kaotikus viselkedst is. Ezenfell
a hl egy adott bemenetre adott vlasza a kezdeti llapottl fgg, amely a korbbi bemenetektl fgghet.
Ennlfogva a rekurrens hlk (ellenttben az elrecsatolt hlkkal) rvid tv memrit is biztosthatnak.
Ezltal rdekesebb vlnak mint agymodellek, de egyben nehezebben is rthetk. Ez a rsz az elrecsatolt
hlkra koncentrl, a fejezet vgn nhny hivatkozst adunk, segtve a rekurrens hlk tovbbi
tanulmnyozst.
Nzzk meg kzelebbrl azt az lltst, hogy az elrecsatolt hl a bemeneteinek fggvnyt reprezentlja.
Vizsgljuk a 20.18. bra egyszer hlzatt, amelynek kt bemeneti egysge, kt rejtett egysge (hidden unit)
s egy kimeneti egysge van. (Az egyszersg kedvrt ebben a pldban elhagytuk az eltolsegysgeket.)
Adott x = (x1, x2) bemeneti vektor esetn a bemeneti egysgek aktivcija (a1, a2) = (x1, x2), s a hlzat a
kvetkez szmtst vgzi:
a5 = g(W3,5a3 + W4,5a4)
= g(W3,5g(W1,3a1 + W2,3a2) + W4,5g(W1,4a1 + W2,4a2)) (20.11)
651
Created by XMLmind XSL-FO Converter.
Azaz kifejezve a rejtett egysgek kimenett, mint a sajt bemeneteik fggvnyt, megmutattuk, hogy az egsz
hl a5 vgs kimenete a hl bemeneteinek fggvnye. Tovbb azt ltjuk, hogy a hl slyai ennek a
fggvnynek a paramtereiknt szolglnak; ha W-vel jelljk a paramtereket, akkor a hl a hW(x) fggvnyt
szmtja ki. Ha vltoztatjuk a slyokat, akkor vltozik a hl ltal reprezentlt fggvny. Ez a mdja a neurlis
hlk tanulsnak.
A neurlis hlt osztlyozsra vagy regresszira hasznlhatjuk. Ha folytonos kimenete van a hlnak (pl.
szigmoid egysgekkel), akkor logikai osztlyozs esetn hagyomnyosan egy kimeneti egysget hasznlunk, s
ha ennek aktivcis rtke 0,5 feletti, azt az egyik, ha 0,5 alatti, akkor a msik osztlyba tartozsknt
interpretljuk. Egy k osztlyos osztlyozsi feladatnl feloszthatjuk az egyetlen kimeneti egysg
rtktartomnyt k rszre, de megszokottabb, hogy ehelyett k elklnlt kimeneti egysget hasznljunk, ahol
mindegyiknek az aktivcis rtke a bemenet adott osztlyba tartozsnak valsznsgt reprezentlja.
Az elrecsatolt hlkat rendszerint rtegekbe (layer) szervezzk oly mdon, hogy minden egyes egysg csak a
kzvetlenl megelz rteg egysgeitl kap bemeneti jelet. A kvetkez kt alfejezetben egyrszt az egyrteg
hlzatokkal foglalkozunk, amelyeknek nincsenek rejtett egysgei, msrszt a tbbrteg hlkkal, amelyek egy
vagy tbb rejtett rteggel rendelkeznek.
652
Created by XMLmind XSL-FO Converter.
20.19. bra - (a) Egy perceptronhlzat hrom kimeneti egysgbl, amelyeknek t kzs
bemenete van. Ha kivlasztunk egy kimeneti egysget (mondjuk a msodikat, vastag
vonallal kiemelve), akkor azt ltjuk, hogy bemeneti sszekttetsei nincsenek semmilyen
hatssal a tbbi kimeneti egysgre. (b) Egy ktbemenet szigmoid aktivcis fggvny
perceptronegysg kimenetnek brzolsa.
Fontos
A W x = 0 egyenlet egy hiperskot hatroz meg a bemeneti trben, teht a perceptron akkor s csak
akkor ad 1-et, ha a bemenet ennek a hipersknak az egyik oldaln van. Ezrt a kszbperceptront
lineris szepartornak (linear separator) is nevezik. A 20.20. (a) s (b) bra mutatja a szeparl
hiperskot (ami kt dimenziban egy egyenes) a ktbemenet s, illetve vagy fggvnyek
perceptronreprezentcija esetn. Fekete ptty jelzi a bemeneti tr olyan pontjait, amelyekre a
fggvny rtke 1, fehr ptty pedig az olyan pontokat, amelyre 0 ez az rtk. A perceptron azrt kpes
reprezentlni ezt a fggvnyt, mert ltezik olyan egyenes, ami az sszes fehr pontot az sszes
fekettl elvlasztja. Az ilyen fggvnyeket linerisan szeparlhatnak (linearly separable)
nevezzk. A 20.20. (c) bra egy olyan fggvnyre mutat pldt, amely nem szeparlhat linerisan ez
az xor fggvny. Nyilvnvalan nincs lehetsg arra, hogy egy kszbperceptron megtanulja ezt a
fggvnyt. ltalnossgban elmondhat, hogy egy kszbperceptron csak linerisan szeparlhat
fggvnyek reprezentcijra kpes. Ez a fggvnyeknek csak kis tredkt jelenti; a 20.14. feladat azt
kri, hogy fejezze ki szmszeren, mekkora is ez a tredk. A szigmoiddal felptett perceptronok
hasonlkppen korltozott kpessgek abban az rtelemben, hogy csupn lgy lineris
szepartorokat reprezentlnak. (Lsd 20.19. (b) bra.)
653
Created by XMLmind XSL-FO Converter.
Fontos
Korltozott kifejezkpessge ellenre a kszbperceptronnak vannak elnyei is. Klnsen is fontos,
hogy ltezik olyan egyszer tanul algoritmus, amely a kszbperceptront tetszleges linerisan
szeparlhat adathalmazra kpes illeszteni. Mgsem mutatjuk most be ezt, inkbb levezetnk egy
ehhez kzel ll tanul algoritmust a szigmoid perceptronokra.
Ennek az algoritmusnak az az alapgondolata (valjban a neuronhl tanul algoritmusok legtbbjnek is ez),
hogy a tant mintahalmazon mrt hiba valamilyen mrtknek minimalizlsa rdekben mdostjuk a
neuronhl slyait. Teht a tanulst formlisan a slytrben (weight space) vgzett optimalizlsi keressknt
fogalmazzuk meg.9 A hiba klasszikus mrtke a ngyzetes hibasszeg, amit a lineris regresszinl a 2.3.
szakasz - Maximum-likelihood paramtertanuls: folytonos eset rszben is hasznltunk. Egyetlen, x bemenettel
s y kvnt kimenettel megadott plda ngyzetes hibja a kvetkezkppen rhat fel:
ahol g' az aktivcis fggvny derivltja.10 Amikor a gradiensalap algoritmusban cskkenteni akarjuk E-t, a
slyfrissts sszefggse a kvetkez:
Wj Wj + Err g'(in) xj (20.12)
ahol a btorsgi faktor (vagy tanulsi faktor, learning rate). Intuitve ez nagyon sszer. Ha a hiba Err = y
hW(x) pozitv, akkor a hl kimenete tl kicsi, teht a pozitv bemenetekhez tartoz slyokat nveljk, a
negatvakhoz tartozkat pedig cskkentjk. Ha a hiba negatv, akkor ppen ennek ellenkezje trtnik. 11
A teljes algoritmus a 20.21. brn lthat. Egyesvel sorban vgigfuttatja a mintkat a hln, s minden egyes
plda utn a hiba cskkentse rdekben kiss mdostja a slyokat. A mintahalmaz egyszeri vgigfuttatst
A folytonos terekben hasznlhat ltalnos optimalizlsi technikkat lsd a 4.4. alfejezetben.
Szigmoid fggvny esetn ez a derivlt g' = g(1 g).
11
Kszbperceptronokra, ahol g'(in) nem definilt, a Rosenblatt (Rosenblatt, 1957) ltal kidolgozott eredeti perceptron tanulsi szably
(perceptron learning rule) megegyezik a (20.12) egyenlettel, leszmtva, hogy a g'(in) kimarad. Mivel g'(in) minden slyra azonos,
elhagysa az egyes mintknl sszessgben csak a slyfrissts nagysgt vltoztatja meg, az irnyt nem.
9
10
654
Created by XMLmind XSL-FO Converter.
epochnak (epoch) nevezzk. Az epochokat addig ismteljk, amg valamilyen lellsi felttel nem teljesl
tipikus, hogy akkor llunk le, amikor a slyvltozsok mr nagyon kicsiv vlnak. Ms mdszerek esetn ered
gradienst szmtunk az egsz tant halmazra, egyszeren sszeadva az egyes pldknl a (20.12) szrmaz
gradienseket, s az ered gradiens alapjn frisstjk a slyokat. A sztochasztikus gradiens (stochastic
gradient) mdszer nem ciklikusan veszi a tant halmaz mintit, hanem inkbb vletlenszeren vlaszt mintkat
a tant halmazbl.
A 20.22. bra kt klnbz problmra bemutatja a perceptron tanulsi grbjt. A bal oldali brn a 11
logikai bemenetre vonatkoz tbbsgfggvny (teht a kimenet akkor 1, ha 6 vagy tbb bemenet 1) tanulsi
grbje lthat. Vrakozsunknak megfelelen a perceptron meglehetsen gyorsan tanulja a fggvnyt, mivel a
tbbsgfggvny linerisan szeparlhat. Msrszrl viszont a dntsi fa tanul nem nagyon halad a tanulssal,
mert a tbbsgfggvnyt nagyon nehz (br nem lehetetlen) dntsi fban reprezentlni. A jobb oldali brn az
tterem plda lthat. A problma megoldsa knnyen brzolhat dntsi fval, de linerisan nem
szeparlhat. Az adatokra felvett legjobb szeparl sk csak 65%-ot osztlyoz helyesen.
655
Created by XMLmind XSL-FO Converter.
Vegynk egyetlen tant pldt, amelynek kvnt kimeneti rtke T, s legyen erre a pldra a perceptron
vlasza p. Ha T = 1, akkor az adat feltteles valsznsge p, ha T = 0, akkor a feltteles valsznsg (1 p).
Egy egyszer trkk alkalmazsval a log likelihoodot differencilhat formban rhatjuk fel. A trkk az, hogy
ha a 0/1 vltozt egy kifejezs kitevjbe rjuk, akkor indiktorvltozknt (indicator variable) viselkedik:
pTakkor p, ha T = 1, egybknt 1; hasonlkppen (1 p)(1T) akkor (1 p), ha T = 0, klnben 1. Ezek szerint az
adat log likelihood rtkt felrhatjuk, mint:
L = log pT(1 p)(1 T) = T log p + (1 T) log(1 p) (20.13)
A szigmoid fggvny tulajdonsgainak hla, a gradiens rendkvl egyszer formra hozhat (20.16. feladat):
Fontos
Vegyk szre, hogy szigmoid perceptronok esetn a maximum-likelihood tanuls slyfrisstsi vektort
megad egyenlete alapveten azonos a ngyzetes hiba minimalizlsn alapul frissts vektorval.
Teht azt mondhatjuk, hogy a perceptronnak mg akkor is van valsznsgi interpretcija, ha a
tanulsi szablyt determinisztikus megkzeltssel szrmaztattuk.
656
Created by XMLmind XSL-FO Converter.
A tbbrteg hl tanul algoritmusa hasonl a 20.21. brn bemutatott perceptrontanulsi algoritmushoz. Egy
kisebb klnbsg, hogy tbb kimenet is lehet, gy nem egy skalr kimeneti rtknk, hanem egy hW(x) kimeneti
vektorunk van, s minden egyes pldhoz is egy y kvnt kimeneti vektor tartozik. Fontosabb klnbsg, hogy
mg a kimeneti rtegben a hiba nyilvnvalan y hW, addig a rejtett rtegben a hiba misztikusnak tnik, hiszen a
tant mintk nem mutatjk, hogy minek kellene lennie a rejtett csompontok rtknek. Kiderl, hogy a hibt
viszszaterjeszthetjk (back-propagate) a kimeneti rtegrl a rejtett rtegekre. A hiba-visszaterjesztsi eljrs
(back-propagation) kzvetlenl kiaddik a teljes hibagradiens levezetsbl. Elszr egy intuitv bizonytssal
mutatjuk be az eljrst, majd megmutatjuk a levezetst is.
A kimeneti rtegre a slyfrisstsi szably azonos a (20.12) egyenlettel. Tbb kimenetnk van, legyen Erri az y
hW hibavektor i-edik komponense. Hasznos lesz, ha bevezetjk a mdostott hibt, i = Erri g'(ini)-t, gy a
slyfrisstsi szably:
Wj,i Wj,i + aj i (20.14)
Ahhoz, hogy a bemeneti neuronok s a rejtett neuronok kzti sszekttetsek frisstst megoldjuk, a kimeneti
csompontok hibjhoz hasonl mennyisget kell definilnunk. Ez az a pont, ahol a hiba-visszaterjesztst
vgezzk. A gondolat az, hogy a j rejtett csompont valamilyen arnyban felels minden egyes vele
sszekttetsben lv kimeneti csompont i hibjrt. gy a i rtkeket a rejtett csompont s a kimeneti
csompont kztti sszekttets erssge alapjn osztjuk s visszaterjesztjk, hogy megkapjuk a rejtett rteg j
rtkeit. A rtkek terjesztsi szablya a kvetkez:
657
Created by XMLmind XSL-FO Converter.
Ezek utn a bemenetek s a rejtett rteg kztti slyok frisstsi szablya szinte azonos a kimeneti rteg frisstsi
szablyval:
Wk,j Wk,j + ak j
ahol az sszegzs a kimeneti rteg csompontjaira vonatkozik. Egy bizonyos Wj,i slyra vett gradiens
kiszmtshoz csak az ai aktivcit kell derivlnunk, mivel az sszeg sszes tbbi tagja fggetlen Wj,i-tl:
658
Created by XMLmind XSL-FO Converter.
ahol i-t az elzkkel megegyezen definiltuk. Ahhoz, hogy a bemeneti rteget s a rejtett rteget sszekt
Wk,j slyokra vonatkoz gradienst megkapjuk, meg kell tartanunk az i feletti teljes sszegzst, hiszen az sszes
kimeneti ai rtkre hatssal lehetnek Wk,j vltozsai. Az aj aktivcikat szintn mind ki kell fejtennk.
Aprlkosan bemutatjuk a levezetst, mivel rdekes megfigyelni, ahogy a differencil opertor visszaterjed
hln keresztl:
ahol a j-t az elzkkel megegyezen definiltuk. Teht megkaptuk azt a frisstsi szablyt, amelyet mr
korbban megkaptunk intuitv ton is. Az is nyilvnval, hogy az eljrs folytathat tbb mint egy rejtett rteg
hlkra is, ami igazolja a 20.25. brn bemutatott ltalnos algoritmust.
Keresztlverekedvn magunkat (vagy tugorva) a matematikai levezetsen lssuk most, hogy milyen
teljestmnyt nyjt egy egy-rejtett-rteg hl az tterem problmn. A 20.26. brn kt grbt mutatunk be. Az
els a tantsi grbe (training curve), amely a slyfrissts sorn az tlagos ngyzetes hiba alakulst mutatja
egy adott 100 elem tterem pldahalmazon mrve. Ez jl demonstrlja, hogy a hl valban konvergl a tant
mintkra val tkletes illeszkedshez. A msodik grbe az tteremadatok standard tanulsi grbje. A neurlis
hl jl tanul, br nem annyira gyorsan, mint a dntsi fa tanuls. Ez taln nem meglep, hiszen az adatokat egy
egyszer dntsi fval generltuk.
20.26. bra - (a) Az tterem problma egy adott pldahalmazn felvett tanulsi grbe,
ami a slyok szmos epoch sorn trtn mdostsval elrt fokozatos hibacskkenst
mutatja. (b) sszehasonlt tanulsi grbk, amelyek azt mutatjk, hogy a dntsi fa
tanuls valamivel jobb teljestmnyt ad, mint a tbbrteg hl hiba-visszaterjesztses
tanulsa.
659
Created by XMLmind XSL-FO Converter.
A neurlis hlk termszetesen messze bonyolultabb tanulsi feladatokra kpesek, br meg kell jegyeznnk,
hogy szksg van nmi babrlsra ahhoz, hogy megfelel hlstruktrt kapjunk, s a slytrben valahol a
globlis optimum kzelbe konvergljunk. A sz szoros rtelmben tzezerszm vannak publiklt neurlis hl
alkalmazsok. A 20.7. alfejezet alaposabban bemutat egyet.
6. Kernelgpek
Azt figyeltk meg, hogy a nagyon nagy hlk mindaddig jl ltalnostanak, amg a slyaikat kis rtken tartjuk. Ez a megszorts az
aktivcis rtkeket a g(x) szigmoid fggvny lineris tartomnyban tartja, ahol x kzel nulla. Ez viszont azt jelenti, hogy a hl gy
viselkedik, mint egy sokkal kevesebb paramterrel rendelkez lineris fggvny (lsd 20.17. feladat).
14
660
Created by XMLmind XSL-FO Converter.
A neurlis hlk trgyalsa utn maradt egy dilemmnk. Az egyrteg hlknak nagyon egyszer s hatkony
tanulsi algoritmusuk van, de nagyon korltozott a kifejezkpessgk, csupn lineris dntsi hatrokat
kpesek megtanulni a bemeneti trben. Msrszt a tbbrteg hlk sokkal kifejezbbek ltalnos nemlineris
fggvnyeket kpesek reprezentlni , de a rengeteg loklis minimum jelenlte, illetve a sokdimenzis slytr
miatt nagyon nehz a tantsuk. Ebben az alfejezetben egy relatve j tanulmdszer csaldot fedeznk fel, az
gynevezett szupport vektor gpeket (support vector machines, SVM), vagy ltalnosabban a kernelgpeket
(kernel machines). Bizonyos fokig a kernelgpek a kt oldal legjobb tulajdonsgait egyestik. Azaz ezek a
mdszerek hatkony tantsi algoritmusokat alkalmaznak, ugyanakkor kpesek bonyolult, nemlineris
fggvnyek reprezentlsra.
A kernelgpek teljes mlysg trgyalsa meghaladja ennek a knyvnek a kereteit, de a f gondolatot egy
pldn keresztl illusztrljuk. A 20.27. (a) bra egy ktdimenzis bemeneti teret mutat, amelyet az x = (x1, x2)
attribtumok rnak le. A pozitv pldk (y = +1) egy kr alak rsz belsejben, a negatv pldk (y = 1) azon
kvl helyezkednek el. Nyilvnval, hogy a problma megoldsra nem ltezik lineris szepartor. Tegyk fel,
hogy valamilyen szmtott tulajdonsgok segtsgvel j formra hozzuk a pldkat azaz az sszes bemeneti x
vektort lekpezzk a tulajdonsgrtkekbl formlt j, F(x) vektorra. A pldban hasznljuk a kvetkez hrom
tulajdonsgot:
Rvidesen ltni fogjuk, hogy honnan vesszk ezeket a tulajdonsgokat, de most csak nzzk meg azt, hogy mi
is trtnt. A 20.27. (b) bra mutatja az adatokat az j, a tulajdonsgok ltal definilt hromdimenzis trben:
ebben a trben linerisan szeparlhatk! Ez a jelensg elgg ltalnos: ha az adatokat megfelelen
sokdimenzis trbe kpezzk le, akkor mindig linerisan szeparlhatk lesznek. Itt mi csak hrom dimenzit
hasznltunk,15 de ha N pontunk van akkor specilis esetek kivtelvel , egy N 1 vagy ennl magasabb
dimenzis trben a pontok mindig linerisan szeparlhatk lesznek (lsd 20.21. feladat).
20.27. bra - (a) Egy ktdimenzis tant halmaz, amelyben a pozitv pldkat fekete, a
negatvakat fehr krk jellik. Az
Ugyanazok az adatok az
hromdimenzis trbe val lekpezs utn. Az (a)
brn lthat kr alak dntsi hatr a hromdimenzis trben lineris dntsi
felletbe ment t.
Ennyi az egsz? Egyszeren ltrehozunk egy nagy halom szmtott tulajdonsgot, s a megfelel sokdimenzis
trben megkeressk a lineris szepartort? Sajnlatos mdon nem ilyen egyszer. Emlkezznk, hogy a d
dimenzis trben a lineris szepartort egy d paramteres egyenlet hatrozza meg, gy aztn az a veszly
15
Az olvas felfedezheti, hogy elg lett volna csupn f1 s f2 hasznlata, de a 3D lekpezs jobban illusztrlja az tletet.
661
Created by XMLmind XSL-FO Converter.
fenyeget, hogy ha d N (ahol N az adatpontok szma), akkor knnyen tlilleszkedhetnk az adatokra. (Ez
ahhoz hasonl, mint amikor egy magas fokszm polinommal tlillesztnk adatokat, ahogy ezt a 18. fejezetben
trgyaltuk.) Ezen okbl a kernelgpek rendszerint az optimlis lineris szepartort talljk meg. Azt nevezzk
optimlisnak, amelynek legnagyobb a tartalka (margin): a lineris szepartor s a pozitv pldk kztt az
egyik oldalon, illetve a lineris szepartor s a negatv pldk kztt a msikon. (Lsd 20.28. bra.) A
szmtgpes tanuls elmlet mdszereit (lsd 18.5. alfejezet) hasznlva megmutathat, hogy ez a szepartor az
j pldk robusztus ltalnostsra nzve nagyon j tulajdonsgokkal rendelkezik.
20.28. bra - Az els kt dimenzira vettett kzelkp: a 20.27. (b) bra optimlis
szepartora. A szepartort vastag vonallal jelltk, a hozz legkzelebbi pontokat a
szupport vektorokat bekarikztuk. A tartalk nem ms, mint a pozitv s negatv
pldk kzti elvlaszt sv szlessge.
Hogyan talljuk meg ezt a szepartort? Kiderl, hogy ez egy kvadratikus programozssal (quadratic
programming) megoldhat optimalizlsi feladat. Tegyk fel, hogy xi pldink vannak, az osztlybasorolsuk
yi = 1, s a bemeneti trben optimlis szepartort akarunk tallni. Ekkor a megoldand kvadratikus
programozsi feladat azon paramterrtkek megtallsa, amelyek az i 0 s ii yi = 0 korltoz felttelek
mellett maximljk a kvetkez kifejezst:
662
Created by XMLmind XSL-FO Converter.
Fontos
Br ennek a kifejezsnek a derivlsa nem nagyon fontos pontja a trtnetnek, de azrt van kt
lnyeges tulajdonsga. Elszr is a kifejezsnek egyetlen, globlis maximuma van, ami hatkonyan
megtallhat. Msodszor az adatok kizrlag pontprok skalrszorzataknt jelennek meg a
kifejezsben. Ez a msodik tulajdonsg magra a szepartorra is igaz, ha az optimlis i-ket
kiszmtottuk, akkor:
Az ezen egyenlettel definilt optimlis szepartor utols fontos tulajdonsga az, hogy az egyes adatpontokkal
asszocilt i slyok mind nullk, kivve a szepartorhoz legkzelebb es pontokat ezeket nevezzk szupport
vektoroknak (support vector). (Azrt nevezzk gy ket, mert k tartjk a szeparl skot.) Mivel rendszerint
jval kevesebb szupport vektor van, mint adatpont, ezrt az optimlis szepartort meghatroz tnyleges
paramterszm rendszerint jval kisebb N-nl.
Rendszerint nem vrhatjuk el, hogy lineris szepartort talljunk az x bemeneti trben, de knnyen belthat,
hogy a sokdimenzis F(x) tulajdonsgtrben tallhatunk lineris szepartorokat. Ennek rdekben a (20.17)
egyenletben xi xj-t egyszeren kicserljk F(xi) F(xj)-re. Ez nmagban nem tlzottan figyelemre mlt x
kicserlse F(x)-re brmely tanul algoritmusban elrn a kvnt hatst , de a skalrszorzatnak van nhny
rdekes tulajdonsga. Az F(xi) F(xj) gyakran kiszmthat anlkl, hogy elszr kiszmtannk minden pontra
F-et. A (20.16) egyenlettel definilt hromdimenzis tulajdonsgtr pldnkban nmi algebrai talaktsokkal
megmutathat, hogy:
F(xi) F(xj) = (xi xj)2
Az (xi xj)2 kifejezst kernelfggvnynek (kernel function) nevezzk, s K(xi, xj)-vel jelljk. A kernelgpek
szempontjbl ez egy olyan fggvny, amely pontprokra alkalmazhat avgett, hogy valamilyen
tulajdonsgtrben kiszmtsuk a skalrszorzatukat. Ennek megfelelen jrafogalmazhatjuk lltsunkat: a
(20.17) egyenletben xi xj-t egyszeren kicserlve a K(xi, xj) kernelfggvnyre, a sokdimenzis F(x)
tulajdonsgtrben tallhatunk lineris szepartorokat. gy a tanulst a sokdimenzis trben vgezhetjk, de
csupn kernelfggvnyek rtkt kell kiszmtanunk, nem kell az szszes pontra a tulajdonsgok teljes kszlett
kiszmtani.
Fontos
A kvetkez lps aminek most mr kzenfekvnek kell lennie az, hogy meglssuk, a K(xi, xj) = (xi
xj)2 kernelben nincs semmi klnleges. Ez egy bizonyos sokdimenzis tulajdonsgtrnek felel meg, de
ms kernelfggvnyek ms tulajdonsgterekkel vannak kapcsolatban. A Mercer-ttel (1909) azt
mondja ki, hogy brmely sszer16 kernelfggny megfelel valamilyen tulajdonsgtrnek. Ez a
tulajdonsgtr mg egsz rtatlannak ltsz kernelek esetn is nagyon nagy lehet. Pldul a K(xi, xj) =
(1 + xi xj)d polinomilis kernel (polynomial kernel) egy olyan tulajdonsgtrnek felel meg,
amelynek dimenzija d-ben exponencilis. Ha a (20.17) egyenletben ilyen kerneleket hasznlunk,
akkor hatkonyan kereshetnk lineris szepartorokat sok millird (vagy egyes esetekben vgtelen)
dimenzis terekben. Az eredmnyknt kapott lineris szepartorokat visszavettve az eredeti bemeneti
trbe, a pozitv s negatv pldkat elvlaszt tetszlegesen tekervnyes, nemlineris hatrfelleteket
kaphatunk.
Emltettk az elz rszben, hogy a kernelgpek kiemelkeden teljestenek a kzrsos szmjegyek
felismersben, de gyorsan felhasznljk ket ms alkalmazsokhoz is, klnsen olyanokhoz, ahol sok
bemeneti tulajdonsg van. Ennek a folyamatnak rszeknt szmos j kernelt dolgoztak ki, amelyek
karakterfzrekre, fkra s ms nemnumerikus adattpusokra alkalmazhatk. Az is megfigyelhet, hogy a
kernelmdszer nemcsak optimlis szepartorok keressre alkalmas, hanem brmely olyan algoritmusra, amely
gy talakthat, hogy csak adatpontprok skalrszorzatt hasznlja, mint a (20.17), illetve (20.18) egyenlet.
Amint ezt sikerlt megtennnk, a skalrszorzat kicserlhet egy kernelfggvnyre, s elksztettk az
algoritmus kernelestett (kernelized) vltozatt. Ez az talakts tbbek kzt a k-legkzelebbi-szomszd
algoritmusra s a perceptron tanulsra is knnyen elvgezhet.
16
Itt sszer alatt azt rtjk, hogy a kij = K(xi, xj) mtrix pozitv definit; lsd A) fggelk.
663
Created by XMLmind XSL-FO Converter.
664
Created by XMLmind XSL-FO Converter.
Az alakilleszts (shape matching) a szmtgpes lts egyik eljrsa, amelyet arra hoztak ltre, hogy trgyak
kt klnbz kpnek megfelel rszeit sszerendeljk. (Lsd 24. fejezet.) Az alaptlet, hogy vegynk egy-egy
ponthalmazt mindkt kprl, s szmtsuk ki az els kp minden egyes pontjra, hogy a msodik kp mely
pontja felel meg neki. Ebbl a megfeleltetsbl aztn szmtsuk ki a kt kpet sszekapcsol transzformcit.
Ez a transzformci a kpek kzt egy tvolsgmrtket hatroz meg. Ez a tvolsgmrtk indokoltabb, mint
egyszeren az egymstl klnbz pixelek megszmllsa. Kiderlt, hogy az erre a tvolsgmrtkre alapozott
3-legkzelebbi-szomszd algoritmus nagyon jl mkdik. Csupn 20 000-et hasznlva a 60 000 szmjegybl, s
egy Canny ldetektor kpnek csupn 100 pixelt felhasznlva az alakillesztses eljrs 0,63% teszthibaarnyt
rt el.
Becslsek szerint az emberek (human) kb. 0,2% hibaarnyt rnek el ennl a problmnl. Ez a szm
nmikppen gyans, mert az embereket nem teszteltk olyan alaposan, mint a gpi tanuls algoritmusait. Az
Egyeslt llamok Postjnak (United States Postal Service) egy hasonl szmjegyekbl kpzett
adathalmazn az emberek ltal elkvetett hibaarny 2,5% volt.
A kvetkez bra sszegzi a trgyalt ht eljrs esetn a hibaarnyt, a futsi idt, a memriaignyt s a
szksges tantsi idt. Mg egy mrtket ad ezekhez, a szmjegyek azon arnyt, amelyet vissza kell
utastanunk, hogy a 0,5% hibaarnyt elrjk. Ha pldul egy SVM-nek megengedjk, hogy bemeneti kpeinek
1,8%-t visszautastsa azaz tpasszolhatja valakinek, hogy az hozza meg a vgs dntst , akkor a kpek
tbbi 98,2%-n a hibaarny 1,1%-rl 0,5%-ra cskken.
A kvetkez tblzat a ht trgyalt technikra sszegzi a hibaarnyt s nhny tovbbi jellemzt.
8. sszefoglals
A statisztikai tanuls mdszerei szles skln helyezkednek el: az egyszer tlagszmtsoktl a bonyolult
modellek mint pldul a Bayes-hlk vagy neurlis hlk konstrulsig. Alkalmazsi terletk a
szmtgp-tudomnyra, a mrnki alkalmazsokra, a neurobiolgira, a pszicholgira s a fizikra is kiterjed.
Ebben a fejezetben bemutattunk nhny alapelvet, s zeltt adtunk a matematikai trgyalsbl. A kvetkez f
pontok szerepeltek:
A Bayes-tanulsi (Bayesian learning) mdszerek a tanulst valsznsgi kvetkeztetsknt fogalmazzk
meg, a megfigyelsek alapjn frisstve a hipotzisek a priori eloszlsait. Ez a megkzelts j eszkz az
Ockham borotvja elv megvalstsra, de bonyolult hipotzisterek esetn hamar kezelhetetlenn vlik.
A maximum a posteriori (MAP) tanuls az adatok alapjn vlaszt ki egyetlen, a legvalsznbb hipotzist.
A hipotzis priort itt is hasznljuk, ez a mdszer gyakran jobban kezelhet, mint a tiszta Bayes-tanuls.
665
Created by XMLmind XSL-FO Converter.
A maximum-likelihood tanuls egyszeren azt a hipotzist vlasztja, amely maximlja az adatok likelihood
rtkt. Megfelel egy egyenletes prior mellett vgrehajtott MAP-tanulsnak. Egyszer esetekben, mint a
lineris regresszi s a teljesen megfigyelhet Bayes-hlk, a maximum-likelihood megolds knnyen
elllthat zrt alakban. A naiv Bayes- (naive Bayes) tanuls klnsen hatkony technika, amely
klnbz bonyolultsg feladatokra is jl illeszthet.
Amikor a vltozk kzt van nhny rejtett (nem megfigyelhet), akkor az EM algoritmussal loklis
maximum-likelihood megoldsokat tallhatunk. Az alkalmazsok kiterjednek a kevert Gauss-jelek
osztlyozsra, a Bayes-hlk tanulsra s a rejtett Markov-modellek tanulsra.
A modellvlasztsra (model selection) ad pldt a Bayes-hlk struktrjnak tanulsa. Ez rendszerint egy, a
struktrk terben vgzett diszkrt keresst foglal magban. Szksg van valamilyen mdszerre a modell
bonyolultsga s az illeszkeds mrtke kzti kompromisszum ltrehozshoz.
A pldnyalap modellek (instance-based model) a tant pldnyok gyjtemnynek eloszlst
reprezentljk. gy a paramterek szma a tant halmaz mretvel n. A legkzelebbi-szomszd (nearest
neighbor) mdszerek a krdses mintapont kzelben lv pldnyokat nzik, mg a kernelmdszerek az
sszes pldny tvolsggal slyozott kombincijt.
A neurlis hlk (neural networks) nem msok, mint sok paramterrel rendelkez, komplex nemlineris
fggvnyek. Paramtereiket zajos adatok alapjn tanulhatjk meg. Tbb ezer alkalmazsban hasznltk mr
ket.
A perceptron egy elrecsatolt neurlis hl, amelynek nincs rejtett rtege, s csak linerisan szeparlhat
(linearly separable) fggvnyek reprezentlsra alkalmas. Ha az adatok linerisan szeparlhatk, akkor egy
egyszer slyfrisstsi szably alkalmazsval az adatokra val pontos illeszkedst tudunk elrni.
A tbbrteg elrecsatolt (multilayer feed-forward) neurlis hlk ha kell szm neuronjuk van
tetszleges fggvnyek reprezentlsra kpesek. A hiba-visszaterjesztsi (back-propagation) algoritmus a
kimeneti hiba minimalizlsa rdekben gradiensalap cskkentst valst meg a paramtertrben.
A statisztikai tanuls tovbbra is igen aktv kutatsi terlet. Mind az elmlet, mind a gyakorlat hatalmas
lpsekkel haladt, mg elrtnk addig a pontig, hogy szinte brmely modell megtanulhat, ha megvalsthat r
egzakt vagy kzelt kvetkeztets.
Homeosztzis: egy szervezet klnbz, de egymssal klcsnhatsban ll elemei vagy elemek csoportjai kztt fennll stabil
egyensly vagy egyensly fel val trekvs. Gyakran biolgiai sszefggsben hasznlt kifejezs. (A ford.)
17
667
Created by XMLmind XSL-FO Converter.
Frank Rosenblatt (Rosenblatt, 1957) nevhez fzdik a modern perceptron felfedezse, s bizonytotta be a
perceptronkonvergencia ttelt (Rosenblatt, 1960), br ezt mr a neurlis hlk terletn kvl es, tisztn
matematikai munkk is elrevettettk (Agmon, 1954; Motzkin s Schoenberg, 1954). Volt nmi, a tbbrteg
hlzatokra irnyul korai kutats is, amelynek eredmnyei pldul a Gamba-perceptronok (Gamba s trsai,
1961) s a madaline-ok (Widrow, 1962). A Learning Machines (Nilsson, 1965) c. knyv ttekintst ad a korai
kutats legnagyobb rszrl. A korai perceptronkutatsok hallt siettette a szerzk ksbbi lltsa szerint
csak magyarzta a Perceptrons c. knyv (Minsky s Papert, 1969), amelyben a terlet matematikai
precizitsnak hinyt panaszoltk fel. A knyv rmutatott, hogy egyrteg perceptronokkal csak linerisan
szeparlhat helyzetek reprezentlhatk, s felhvta a figyelmet a tbbrteg hlk hatkony tanul
algoritmusainak hinyra.
A San Diegban, 1979-ben tartott konferencia publikciira alapozott kiadvny (Hinton s Anderson, 1981)
tekinthet a konnekcionizmus jjledse jelnek. Nagy figyelmet keltett a ktrszes PDP (Prhuzamos
elosztott feldolgozs Parallel Distributed Processing) antolgia (Rumelhart s trsai, 1986a), illetve a Natureben megjelent rvid cikk (Rumelhart s trsai, 1986b). A neurlis hlkkal foglalkoz cikkek szma az 1980
1984 kztti publikcik szmrl 200-szorosra ntt 19901994-re. A mgneses spin vegek fizikai
elmletnek felhasznlsval elvgzett neurlis hl analzis (Amit s trsai, 1985) nem csupn szorosabb
kapcsolatot hozott a statisztikus mechanika s neurlis hlk elmlete kzt, hanem tekintlyt is adott a
terletnek. A hiba-visszaterjeszts (back-propagation) technikjt viszonylag hamar kitalltk (Bryson s Ho,
1969), de tbb alkalommal jra felfedeztk (Werbos, 1974; Parker, 1985).
Az 1990-es vekben megjelent szupport vektor gpeknek (Cortes s Vapnik, 1995) napjainkban gyorsan
nvekv az irodalmuk, amely olyan tanknyveket is magban foglal, mint Cristianini s Shawe-Taylor knyve
(Cristianini s Shawe-Taylor, 2000). Nagyon npszernek s bizonyos feladatokra nagyon hatkonynak
bizonyultak, ilyenek pldul a szvegkategorizls (Joachims, 2001), a bioinformatikai kutats (Brown s trsai,
2000), a termszetes nyelv szveg feldolgozsa, mint a kzzel rt szmjegyek DeCoste s Schlkopf ltal
megvalstott felismerse (DeCoste s Schlkopf, 2002). A szavaz perceptron szintn egy olyan technika,
amely a kerneltrkkt alkalmazza az exponencilis tulajdonsgtr implicit reprezentcijra (Collins s Duffy,
2002).
Szmos forrs adhat meg a neurlis hlk valsznsgi interpretcijra, pldul (Baum s Wilczek, 1988),
valamint (Bridle, 1990). A szigmoid fggvny szerept Jordan trgyalja (Jordan, 1995). MacKay javasolta a
neurlis hlk Bayes-i paramterbecslst (MacKay, 1992), amelyet Neal fejlesztett tovbb (Neal, 1996). A
neurlis hlk fggvnyreprezentcis kpessgeit Cybenko vizsglta (Cybenko, 1988; 1989), aki megmutatta,
hogy kt rejtett rteg elegend tetszleges fggvny reprezentcijhoz, tetszleges folytonos fggvny
reprezentcijhoz pedig elg egy rteg. A haszontalan sszekttetsek eltvoltst clz optimlis
agykrosods mdszer LeCun s trsai eredmnye (LeCun s trsai, 1989), mg Sietsma s Dow mutattk meg,
hogyan kell a felesleges neuronokat eltvoltani (Sietsma s Dow, 1988). A nagyobb struktrk nvesztssel
val ellltsra szolgl csempzsi algoritmus Mzard s Nadal munkja (Mzard s Nadal, 1989). A kzzel
rt szmjegyek felismersvel foglalkoz algoritmusokrl LeCun s trsai rtak ttekint publikcit (LeCun s
trsai, 1995). Azta jobb hibaarnyt rtek el Belongie s trsai (2002) az alakillesztsi eljrs (Belongie s
trsai, 2002), valamint DeCoste s Schlkopf a virtulis szupport gp alkalmazsval (DeCoste s Schlkopf,
2002).
A szmtgpes tanuls elmlete terletn tevkenyked kutatk foglalkoztak a neurlis hl tanuls
komplexitsval. Az els szmtsi eredmnyeket Judd kapta (Judd, 1990), aki megmutatta, hogy egy
pldahalmazzal konzisztens slyhalmaz megtallsnak ltalnos problmja mg nagyon ersen korltoz
felttelek esetn is NP-teljes. A mintakomplexitsra vonatkoz eredmnyek kzl nhny Baum s Haussler
munkjhoz fzdik, akik megmutattk, hogy W sly esetn a hatkony tantshoz szksges mintaszm W log
W arnyban n (Baum s Haussler, 1989).18 Azta Anthony s Bartlett egy sokkal fejlettebb elmletet
fejlesztettek ki (Anthony s Bartlett, 1999), amely magban foglalja azt a fontos eredmnyt, hogy a hl
reprezentcis kpessge a slyok nagysgrendjtl s szmtl egyarnt fgg.
Az ltalunk nem trgyalt legnpszerbb neurlis hl a radilis bzisfggvny (RBF) (radial basis function)
hl. A radilis bzisfggvny kernelek slyozott kombincijt (termszetesen rendszerint Gauss-kernelekt)
alkalmazza fggvnyapproximcira. Az RBF-hlkat kt fzisban tanthatjuk: elszr egy nem ellenrztt
osztlyozssal tantjuk a Gauss-fggvnyek paramtereit (az tlagokat s variancikat), mint a 20.3. alfejezetben
lttuk. A msodik fzisban a Gauss-fggvnyek relatv slyt hatrozzuk meg. Ez egy lineris egyenletrendszer
Ez nagyjbl igazolta Bernie bcsi trvnyt: a szablyt Bernie Widrowrl neveztk el, aki azt javasolta, hogy nagyjbl tzszer annyi
mintt hasznljanak, mint a slyok szma.
18
668
Created by XMLmind XSL-FO Converter.
megoldsa, amirl tudjuk, hogy kzvetlenl hogyan oldhat meg. gy az RBF-tants mindkt fzisnak vonz
tulajdonsgai vannak: az els fzis nem ellenrztt, teht nincs szksgnk hozz cmkzett mintkra, a
msodik ugyan felgyelt, de hatkonyan elvgezhet. A rszleteket lsd Bishop publikcijban (Bishop, 1995).
A rekurrens hlkat (recurrent network), amelyekben a neuronok hurkokba vannak kapcsolva, emltettk
ugyan a fejezetben, de nem rszleteztk. A legjobban megrtett rekurrens hl osztlyt valsznleg a Hopfieldhlk (Hopfield networks) (Hopfield, 1982) alkotjk. A Hopfield-hl ktirny kapcsolatokat hasznl
szimmetrikus slyokkal (azaz Wi,j = Wj,i), minden neuron bemeneti s egyben kimeneti egysg is, a g aktivcis
fggvny az eljelfggvny, az aktivcis szint pedig csak a 1 lehet. A Hopfield-hl asszociatv
memriaknt mkdik: miutn egy mintahalmazon tantottuk, egy j bemeneti stimulus hatsra egy olyan
aktivcis mintra ll be, amely a tant pldk kzl a leginkbb emlkeztet az j bemenetre. Ha pldul a
tant halmaz egy halom fnykp, az j bemenet pedig az egyik fnykp egy kis darabja, akkor aktivcis
szintjeivel a hl vissza fogja lltani az adott darabbl a fnykpet. Figyeljk meg, hogy a fnykpek nincsenek
elklnlten trolva a hlban: mindegyik sly az sszes fnykp egy rszleges kdja. rdekes elmleti
eredmny, hogy az N neuronbl ll Hopfield-hl legfeljebb 0,138N tant mintt kpes megbzhatan trolni.
A Boltzmann-gpek is szimmetrikus slyokat hasznlnak, de tartalmaznak rejtett egysgeket is (Hinton s
Sejnowski, 1983; 1986). Radsul aktivcis fggvnyk sztochasztikus: a kimenet 1 rtknek valsznsge a
teljes slyozott bemenetnek valamilyen fggvnye. A Boltzmann-gpek ennek megfelelen a szimullt lehts
keressi eljrsra (lsd 4. fejezet) emlkeztet llapottmenetek sorn jutnak el a tant halmazt a legjobban
kzelt konfigurcihoz. Kimutathat, hogy a Boltzmann-gpek nagyon kzeli rokonsgban vannak bizonyos
specilis Bayes-hlkkal, amelyeket sztochasztikus szimulcis algoritmussal rtkelnk ki. (Lsd 14.5.
alfejezet.)
A kernelgpek alaptletnek els alkalmazsa Aizerman s trsai munkjhoz fzdik (Aizerman s trsai,
1964, de a szupport vektor gpek fel mutat, teljes elmleti kidolgozs Vlagyimir Vapniknak s kollginak
ksznhet (Boser s trsai, 1992; Vapnik, 1998). A precz elmleti trgyals megtallhat Cristianini s
Shawe-Taylor, illetve Schlkopf s Smola knyvben (Cristianini s Shawe-Taylor, 2000; Schlkopf s Smola,
2002), valamint egy bartsgosabb kifejts tallhat Cristianini s Schlkopf AI Magazine-ban megjelent
cikkben.
Ennek a fejezetnek az anyaga a statisztika, alakfelismers s neurlis hlk kutatsban elrt eredmnyeket
integrlja, teht a trtnetet sokszor, sokfle mdon elmondtk mr. A Bayes-statisztikrl j publikcikat
tallunk, ilyenek pldul a (DeGroot, 1970), a (Berger, 1985), tovbb a (Gelman s trsai, 1995). A statisztikus
tanuls elmletnek kivl trgyalsa tallhat a (Hastie s trsai, 2001) munkban. Az alakosztlyozs
tmakrben Duda s Hart knyve szmt klasszikusnak (Duda s Hart, 1973), melynek nemrg j kiadsa is
megjelent (Duda s trsai, 2001). A neurlis hlkrl a (Bishop, 1995) s a (Ripley, 1996) a legfontosabb
knyvek. A szmtgpes neurlis tudomnyt a (Dayan s Abbott, 2001) knyv trgyalja. A neurlis hlk s
hozzjuk kapcsold tmk legfontosabb konferencii az vente megrendezett NIPS- (Neural Information
Processing Conference) konferencik, melyek kiadvnyait az Advances in Neural Information Processing
Systems sorozatban jelentetik meg. A Bayes-hlk tanulsrl szl rsok az Uncertainty in AI s a Machine
Learning konferencikon jelennek meg, tovbb szmos statisztikval foglalkoz konferencin. A neurlis
hlkkal foglalkoz jsgok kztt rdemes megemlteni a Neural Computationt, a Neural Networkst s az
IEEE Transaction on Neural Networkst.
8.2. Feladatok
20.1.
A 20.1. brn hasznlt adatokat gy tekinthetjk, mintha h5 generlta volna ket. A msik ngy hipotzis
mindegyikre generljon egy-egy 100 hosszsg adathalmazt, rajzolja fel a megfelel P(hi|d1,, dm) s P(Dm+1
= citrom|d1,, dm) grbket! rtkelje az eredmnyeket.
20.2.
Ismtelje meg a 20.1. feladatot gy, hogy a P(Dm+1 = citrom|hmap,, dm), illetve P(Dm+1 = citrom|hml) grbket
rajzolja fel.
20.3.
669
Created by XMLmind XSL-FO Converter.
Tegyk fel, hogy Anna szmra a meggycukorkk hasznossga cA, a citromcukorkk A, mg Bla szmra a
hasznossgok rendre cB s B. (De ha Anna kibontott egy cukorkt, akkor azt Bla mr nem fogja megvsrolni
tle.) Ha Bla sokkal jobban szereti a citromz cukorkt, mint Anna, akkor Anna feltehetleg blcsen teszi, ha
eladja a cukros zacskjt, amikor mr kellen biztos a citromzek arnyban. Msrszrl viszont, ha Anna tl
sok cukrot kibontott mr az arny eldntse sorn, akkor a zacsk rtktelenn vlik. Vizsglja meg a
cukroszacsk-elads optimlis pillanatnak meghatrozst. Hatrozza meg az optimlis eljrs vrhat
hasznossgt, a 20.1. alfejezet a priori eloszlsainak felttelezsvel.
20.4.
Kt statisztikus elmegy az orvoshoz, s mindkettrl ugyanazt a diagnzist lltja fel az orvos: 40% esllyel a
hallos A betegsgben, 60% esllyel a szintn vgzetes B betegsgben szenvednek. Szerencsre van az A s B
betegsgnek is olcs, 100%-ban hatsos, mellkhats nlkli gygyszere. A statisztikusoknak lehetsgk van
az A elleni, a B elleni vagy mindkt gygyszert szedni, de dnthetnek gy is, hogy egyiket sem szedik. Mit fog
az els statisztikus aki elsznt Bayes-hv vlasztani? Mit tesz a msodik, aki mindig a maximum-likelihood
hipotzist vlasztja?
Az orvos nmi kutats utn felfedezi, hogy a B betegsgnek kt vltozata van, a dextro-B s a levo-B, amelyek
egyforma valsznsggel lpnek fel, s egyformn jl kezelhetk az anti-B gygyszerrel. Mit fog csinlni a kt
statisztikus most, hogy hrom hipotzis van?
20.5.
Magyarzza meg, hogyan alkalmazhat a 18. fejezetben trgyalt turbzs mdszere a naiv Bayes-tanulsra.
Tesztelje a kapott algoritmust az tterem tanulsi problmn.
20.6.
Vegyen m darab (xj, yj) adatpontot, az xj-bl a (20.5) egyenlet alapjn generlja yj-t. Keresse meg azokat a 1, 2
s rtkeket, amelyek maximljk az adatok feltteles log likelihood rtkt.
20.7.
Vizsglja a lz 14.3. alfejezetben bemutatott zajos-VAGY modelljt. Magyarzza meg, hogyan alkalmazhat a
maximum-likelihood tanuls arra, hogy egy teljes adathalmazra illesszk egy ilyen modell paramtereit.
(Segtsg: a parcilis derivltakra hasznlja a lncszablyt.)
20.8.
Ebben a feladatban a (20.6) egyenlettel definilt bta-eloszlsok tulajdonsgait vizsgljuk.
a. A [0, 1] tartomny feletti integrls alapjn mutassa meg, hogy a bta[a,b] eloszls normalizl faktort =
(a + b)/ (a) (b) adja, ahol (x) az gynevezett gamma-fggvny, amelynek defincija: (x + 1) = x
(x) s (1) = 1. (Egsz x-ekre (x + 1) = x!)
b. Mutassa meg, hogy az tlagrtk a/(a + b).
c. lltsa el a modus(oka)t (a legvalsznbb rtke(ke)t).
d. Jellemezze a bta[, ] eloszlst nagyon kis esetn. Mi trtnik, ha egy ilyen eloszlst frisstnk?
20.9.
Vegyen egy tetszleges Bayes-hlt, egy ehhez a hlhoz tartoz teljes adathalmazt s az adathalmaznak a hl
ltal megadott likelihood-rtkt. Adjon egyszer bizonytst arra, hogy az adathalmaz likelihood-rtke nem
cskkenhet, ha a hlhoz hozzadunk egy j kapcsolatot, majd jraszmoljuk a maximum-likelihood
paramtereket.
20.10.
Vizsglja meg az EM alkalmazst arra a problmra, amikor a 20.10. (a) brn lthat hl paramtereit
akarjuk tanulni, mikzben az igazi paramterrtkeketa (20.7) egyenlet adja.
670
Created by XMLmind XSL-FO Converter.
a. Magyarzza meg, hogy mirt nem mkdne az EM algoritmus, ha csak kt attribtum volna, s nem hrom.
b. Vgezze el az els itercira vonatkoz szmtst a (20.8) egyenletbl kiindulva.
c. Mi trtnik, ha indulskor az sszes paramtert ugyanarra a p rtkre lltjuk? (Segtsg: hasznos lehet, ha
empirikusan megvizsglja, mieltt az ltalnos eredmnyt megprbln levezetni.)
d. rja fel a 3.2. szakasz - Rejtett vltozkkal felptett Bayes-hlk tanulsa rszben tallhat adattblzatra a
log likelihoodnak a paramterekkel kifejezett sszefggst. Szmtsa ki minden egyes paramterre a
parcilis derivlt rtkt! Vizsglja meg a (c) rszben rgztett pont jellegt.
20.11.
Hozzon ltre manulisan egy olyan neurlis hlt, amely kt bemenetnek az xor fggvnyt szmtja ki.
Bizonyosodjon meg arrl, helyesen specifiklta-e azt, hogy milyen egysgeket kell hasznlni.
20.12.
Hozzon ltre egy olyan szupport vektor gpet, amely az xor fggvnyt szmtja ki. Knyelmesebb lesz, ha mind
a bemeneteknl, mind a kimenetnl 1-et s +1-et hasznl 0 s +1 helyett. Ennek megfelelen egy minta pldul
([1, 1], 1) vagy ([1, 1], 1) lesz. Tipikus, hogy az x bemenetet egy tdimenzis trre kpezzk le, ahol kett
az eredeti x1 s x2 dimenzi, a msik hrom pedig x12, x22, illetve x1 x2 kombincii. Ebben a feladatban viszont
csak kt dimenzit hasznlunk: x1-et s x1 x2-t. Rajzolja fel ebben a trben a ngy bemeneti pontot s a maximlis
tartalkkal rendelkez osztlyozt. Mekkora a tartalk? Rajzolja meg a hatrol vonalat az eredeti, euklideszi
trben.
20.13.
Egy egyszer perceptron nem kpes az xor fggvny (vagy ltalnosabban a paritsfggvny) brzolsra.
Mutassa be, hogy hogyan alakulnak egy ngybemenet, ugrsfggvnyt hasznl perceptron slyai, amikor
sorban a paritsfggvnybl szrmaz mintk rkeznek (kezdetben minden sly 0,1 rtk volt).
20.14.
Idzzk fel a 18. fejezetbl, hogy n bemenet esetn 22 klnbz logikai fggvny ltezik. Hnyat tud
reprezentlni ezek kzl az ugrsfggvnyt hasznl perceptron?
20.15.
Vegyk a kvetkez hat bemeneti rtket (I1I6) s egy, ezekhez tartoz kvnt kimeneti rtket (T) megad
mintahalmazt.
a. Futassa a perceptron tanulsi szablyt erre az adathalmazra, s adja meg a vgs slyokat.
b. Futassa a dntsi fa tanulsi algoritmust, s adja meg az eredmnyl kapott dntsi ft.
c. rtkelje az eredmnyeket.
20.16.
671
Created by XMLmind XSL-FO Converter.
672
Created by XMLmind XSL-FO Converter.
1. Bevezets
A 18. s 20. fejezetben olyan tanul mdszereket mutattunk be, amelyek pldk alapjn fggvnyeket vagy
valsznsgi modelleket sajttanak el. Ebben a fejezetben azzal foglalkozunk, hogy az gens mi mdon
tanulhatja meg azt, hogy mit tegyen, klnsen akkor, amikor nincs tanr, aki minden elfordul krlmny
esetre elruln a helyes cselekvst.
Fontos
Vegyk pldaknt a sakkot. Tudjuk, hogy az gens kpes megtanulni sakkozni felgyelt tanulssal,
vagyis ha pldaknt sakkllsokat mutatunk neki, megnevezve az adott llsban a legjobb lpst. De
mit tud csinlni az gens akkor, ha nincs kznl egy bartsgos tant, aki pldkat mutatna? Vletlen
lpsek kiprblsval vgl is az gens felptheti krnyezetnek prediktv modelljt: milyen lesz az
lls, ha meglp egy adott lpst, esetleg mg azt is modellezheti, hogy az ellenfl vrhatan mit fog
vlaszul lpni. A kvetkez azonban a problma: visszacsatols nlkl teht anlkl, hogy tudn, mi
a j s mi a rossz az gensnek semmilyen alapja sem lesz eldnteni azt, hogy melyik lpst hzza
meg. Az gensnek tudnia kell, hogy valami j trtnt, amikor nyert, illetve valami rossz trtnt, amikor
vesztett. Az ilyen tpus visszacsatolst nevezzk jutalomnak (reward) vagy megerstsnek
(reinforcement). A sakkhoz hasonl jtkokban a megersts csak a jtk vgn jelenik meg. Ms
krnyezetben a jutalom gyakrabban jn, pldul a pingpongban mindegyik pont jutalomnak tekinthet
ppgy, mint a mszs tanulsakor brmely elrefel halads. Az ltalunk hasznlt trgyalsmdban az
gens a jutalmat is az szlels rszeknt kezeli, de valahogy bele kell lennie huzalozva, hogy ez a
rsz jutalom, s nem csupn egy szlelsfajta. gy tnik, hogy az llatokba be van ptve, hogy a
fjdalom s az hsg negatv jutalom, mg a gynyr s az lelem pozitv jutalom. A megerstses
tanulst az llatok pszicholgijt kutatk 60 ve intenzven tanulmnyozzk.
A jutalom fogalmt a 17. fejezetben vezettk be, ahol a Markov dntsi folyamatok (Markov decision
process, MDP) optimalitsnak definilsra szolglt. Optimlis stratginak neveztk azt a stratgit, amely
maximlja a vrhat sszjutalmat. A megerstses tanuls (reinforcement learning) feladata az, hogy
optimlis (vagy kzel optimlis) stratgit tanuljunk az adott krnyezethez. Mg a 17. fejezetben az gensnek a
teljes krnyezeti modell s a jutalomfggvny a rendelkezsre llt, addig a jelen fejezetben egyikrl sem
feltteleznk semmilyen elzetes tudst. Kpzelje el, hogy egy j, ismeretlen jtkot jtszik, amelynek nem
ismeri a szablyait. Nagyjbl szz lps utn az ellenfele bejelenti: n vesztett. Dihjban ez jellemzi a
megerstses tanulst.
Szmos bonyolult problmaterleten a megerstses tanuls az egyetlen lehetsges t arra, hogy egy
programnak magas szint mkdst tantsunk. Pldul a jtkok tern nagyon nehz lenne a szakember dolga: a
lehetsges nagyszm lls pontos s kvetkezetes rtkelst kellene elvgeznie annak rdekben, hogy a
pldk alapjn kzvetlenl megtantson egy kirtkel fggvnyt. Ehelyett a programnak megadhat az az
informci, hogy nyert vagy vesztett, s ezt felhasznlhatja egy olyan kirtkel fggvny tanulsra, amely
elfogadhat pontossggal kpes megbecslni brmely adott llsban a nyers valsznsgt. Hasonlkppen
rendkvl nehz megtantani egy genst helikopter vezetsre, de ha megfelel negatv jutalmat kap minden
balesetnl, bukdcsol mozgsnl vagy a belltott tvonaltl val eltrsnl, akkor az gens nllan
megtanulhat replni.
Bizonyos rtelemben a megerstses tanuls az egsz MI-problmt tfogja. Egy genst belehelyeznk
valamilyen krnyezetbe, s meg kell tanulnia ott sikeresen viselkedni. Ahhoz, hogy ezt a fejezetet ttekinthet
bonyolultsgi szinten tartsuk, csak egyszer helyzetekre s egyszer gensekre fogunk koncentrlni. A fejezet
legnagyobb rszben teljesen megfigyelhet krnyezetet feltteleznk, teht a megfigyelsek informlnak az
aktulis llapotrl. Msrszt viszont azt felttelezzk, hogy az gens sem azt nem tudja, hogyan mkdik a
krnyezet, sem azt, hogy cselekedeteinek mi a hatsa, tovbb megengedjk a cselekedetek valsznsgi
(nemdeterminisztikusan meghatrozott) kimenetelt. Hrom olyan gensfelptst fogunk ttekinteni, amelyeket
elszr a 2. fejezetben vezettnk be:
673
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
674
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
Az gens stratgija felhasznlsval egy sor ksrletet (trial) vgez. Minden egyes ksrletben az (1,1)
llapotbl indul, s az llapottmenetek valamilyen sorozatt szleli, amg el nem rkezik a (4,2), illetve a (4,3)
vgllapotok valamelyikbe. szlelsei alapjn informcit kap mind az aktulis llapotrl, mind az ott nyert
jutalomrl. Pldul gy nzhetnek ki a tipikus ksrletek:
(1,1)0,04(1,2)0,04(1,3)0,04(1,2)0,04(1,3)0,04(2,3)0,04(3,3)0,04(4,3)+1
(1,1)0,04(1,2)0,04(1,3)0,04(2,3)0,04(3,3)0,04(3,2)0,04(3,3)0,04(4,3)+1
(1,1)0,04(2,1)0,04(3,1)0,04(3,2)0,04(4,2)1
Vegyk szre, hogy mindegyik llapotszlels mellett als indexknt feltntettk az elnyert jutalmat. Clunk
a jutalmakban rejl informci felhasznlsa arra, hogy az egyes s llapotokhoz amelyek nem vgllapotok
rendelhet vrhat hasznossgot, U (s)-t megtanuljuk. A hasznossgot gy definiljuk, mint a stratgia
kvetse esetn az sszegzett (lertkelt) jutalom vrhat rtke. Ez ahogy a (17.3) egyenletben a 1.2. szakasz
- Optimalits szekvencilis dntsi problmkban rszben mr felrtuk:
675
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
Fontos
A kzvetlen hasznossgbecslssel sikerlt a megerstses tanulst standard induktv tanulsi
problmra reduklnunk, amelyrl mr nagyon sok mindent tudunk. Sajnlatos mdon egy nagyon
fontos informciforrs hinyzik, nevezetesen az, hogy az llapotok hasznossga nem fggetlen
egymstl! Minden egyes llapot hasznossga egyenl az ebben az llapotban elnyerhet jutalom s az
t kvet llapotok vrhat hasznossgnak sszegvel. Teht a hasznossgrtkek kielgtik a
rgztett stratgira vonatkoz Bellman-egyenletet (lsd mg (17.10) egyenlet):
Azzal, hogy figyelmen kvl hagyja az llapotok kztti sszefggseket, a kzvetlen hasznossg becslse
eljtssza a tanuls lehetsgeit. Pldul a bemutatott hrom ksrlet kzl a msodik rinti a (3,2) llapotot,
amelyet elzleg az gens nem rintett mg. A kvetkez tmenet utn (3,3)-ba jut, amely az els ksrlet
alapjn nagy hasznossgot mutat. A Bellman-sszefggs azonnal rmutat, hogy valsznleg akkor a (3,2)-nek
is nagy a hasznossga, mivel a (3,3)-ba vezet, de a kzvetlen hasznossgbecsls semmit se tanul meg ebbl a
ksrlet vgig. ltalnosabban megfogalmazva azt mondhatjuk, hogy a kzvetlen hasznossgbecslsre gy
tekinthetnk, mint ami jval nagyobb U hipotzistrben keres, mint amire szksg van. Ennek oka, hogy szmos
olyan fggvnyt is szmon tart a hipotzisek kzt, amelyek srtik a Bellman-egyenletet. Emiatt az algoritmus
gyakran csak nagyon lassan konvergl.
21.2. bra - Egy adaptv lineris programozs alapon tanul passzv megerstses
gens. A kd egyszerstse rdekben feltettk, hogy minden egyes szlels
sztbonthat egy szlelt llapotra s egy jutalomjelre.
1
Ez mint a 20. fejezetben is trgyaltuk a maximum-likelihood becsls. Egy Bayes-frissts Dirichlet-priorral jobb is lehet.
676
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
21.3. bra - A passzv ADP-tanul tanulsi grbi a 4 3-as vilg tanulsa sorn, a 21.1.
brn lthat optimlis stratgia hasznlata esetn. (a) Az llapotok egy kivlasztott
rszhalmazra kiszmtott hasznossgbecslsek a ksrletek szmnak fggvnyben.
Figyeljk meg a 78-adik ksrlet krnykn a jelents vltozsokat ez az els eset,
amikor az gens a (4,2) vgllapotba jut, melyben 1 jutalmat kap. (b) Az U(1,1)
hibjnak RMS-rtke 20 egyenknt 100 ksrletbl ll futsra tlagolva.
677
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
gy U(1,3) eszerint 0,88 lenne. Teht a jelenlegi becslt rtk (0,84) egy kicsit alacsonyabb a
kvnatosnl, nvelni kellene. ltalnosabban megfogalmazva, ha egy s-bl s'-be trtn tmenet lp
fel, akkor a kvetkez mdon frisstjk az U (s) hasznossgot:
U(s) U(s) + (R(s) + U(s') U(s)) (21.3)
Fontos
Az idbeli klnbsgen alapul mdszerek alaptlete az, hogy elszr hatrozzuk meg azokat a
feltteleket, amelyek korrekt becslsi rtkek esetn loklisan fennllnak, majd lltsunk fel egy olyan
rtkfrisstsre szolgl egyenletet, amely ezen idelis egyenslyi egyenlet irnyba viszi a
becslseket. Passzv tanuls esetn az egyenslyi egyenletet a (21.2) szolgltatja. A (21.3) egyenlet
tnylegesen a (21.2) ltal megadott egyenslyi helyzetbe viszi az genst, br van nmi finom trkk a
dologban. Elszr vegyk szre, hogy a frissts csak a megfigyelt kvetkez llapotot, s' -t veszi
figyelembe, mg a tnyleges egyenslyi felttel az sszes lehetsges kvetkez llapotot. Azt
hihetnnk, hogy ez tlzottan megvltoztatja U(s)-t, amikor egy ritka tmenet kvetkezik be. Valjban
viszont ritka tmenetek ritkn kvetkeznek be, ezrt az U(s) tlagos rtke a helyes rtkhez fog
konverglni. Tovbb, ha -t megvltoztatjuk gy, hogy ne egy rgztett paramter legyen, hanem egy
fggvny, amely aszerint cskken, ahogy egy llapotnak a ksrletekben trtn elfordulsa n, akkor
maga az U(s) is a helyes rtkhez fog tartani.2 Ez a 21.4. brn lthat gensprogramhoz vezet. A 21.5.
bra bemutatja a passzv IK-gens ltal a 4 3 vilgban mutatott teljestmnyt. Ugyan nem tanul olyan
gyorsan, mint az ADP-gens, s nagyobb vltozkonysgot mutat, de sokkal kevesebb szmtst
ignyel megfigyelsenknt. Vegyk szre, hogy az IK nem ignyel modellt a frissts elvgzshez. A
krnyezet szolgltatja a szomszdos llapotok kzti kapcsolatokat, a megfigyelt tmenetek formjban.
21.4. bra - Egy idbeli klnbsg alapon hasznossgot tanul passzv megerstses
gens
21.5. bra - Az IK-tanuls 4 3-as vilgon mrt tanulsi grbi. (a) Nhny kivlasztott
llapot hasznossgbecslse a ksrletszm fggvnyben. (b) Az U(1,1) becslsnek
RMS-hibja, amelyet 20 futs tlagbl szmoltunk, mindegyik futs 500 ksrletet
tartalmazott. Csak az els 100 ksrletbl szrmaz eredmnyt rajzoltuk fel, hogy a
grbe a 21.3. brval sszehasonlthat legyen.
678
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
Az ADP- s IK-megkzelts valjban szoros rokonsgban van. Mindkett loklis vltoztatsokat vgez a
hasznossgbecslsben annak rdekben, hogy minden egyes llapot megfeleljen a rkvetkezknek.
Ugyanakkor van egy klnbsg. Az IK gy mdostja az llapotot, hogy az megfeleljen a megfigyelt
rkvetkez llapotnak ((21.3) egyenlet). Az ADP viszont gy mdostja az aktulis llapotot, hogy az sszes
lehetsges kvetkez llapotnak megfeleljen, de ezeket az llapotokat a valsznsgkkel slyozza (21.2)
egyenlet). Ez a klnbsg eltnik, amikor az IK-mdostst nagyszm tmenetre tlagoljuk, mivel az
llapothalmaz kvetkez llapotainak gyakorisga nagyjbl arnyos a valsznsgkkel. Egy, az elznl
fontosabb klnbsg, hogy mg az IK minden megfigyelt llapottmenet utn egyetlen mdostst vgez, addig
az ADP annyit, amennyi csak szksges ahhoz, hogy helyrelltsa az U hasznossgbecslsek s a T
krnyezetmodell kzti konzisztencit. Br a megfigyelt llapottmenet csak loklisan vltoztatja meg T-t, de
szksg lehet arra, hogy ezt vgigterjesszk U-n. Ennek megfelelen gy vehetjk, hogy az IK egy durva, de
hatkony kzeltse az ADP-mdszernek.
Mindegyik, az ADP ltal elvgzett mdosts az IK szempontjbl gy is tekinthet, mint az aktulis krnyezeti
modell szimulcija segtsgvel generlt pszeudoksrlet eredmnye. Kiterjeszthetjk az IK-megkzeltst
gy, hogy a krnyezeti modell segtsgvel szmos pszeudoksrletet generljon ltrehozva olyan
tmeneteket, amelyekrl az aktulis krnyezet modellje alapjn az IK-gens el tudja kpzelni, hogy
megtrtnhetnek. Az IK-gens akr nagyszm kpzelt tmenetet is generlhat minden megfigyelt tmenetre.
Ennek eredmnyekppen a hasznossg becslsei egyre inkbb az ADP becslseihez kzeltenek, termszetesen a
fizetend r a megnvekedett szmtsi id lesz.
Hasonl mdon az ADP-eljrs hatkonyabb vltozatait hozhatjuk ltre kzvetlenl approximlva az
rtkiterci s stratgiaiterci algoritmusait. Ne felejtsk, hogy a teljes rtkiterci kezelhetetlenn vlhat, ha
az llapottr nagy. Ugyanakkor a mdostsi lpsek kzl szmos csak nagyon parnyi. Elfogadhatan j
vlaszok gyors generlshoz vezet lehetsges megkzelts, ha megktjk a megfigyelt tmenetek utn
elvgzett mdostsok szmt. Azt is megtehetjk, hogy valamilyen heurisztika segtsgvel rangsoroljuk a
lehetsges mdostsokat, s csak a legfontosabbakat vgezzk el. A prioritsos vgigsprs (prioritized
sweeping) heurisztikja preferlja azon llapotok mdostst, amelyek valszn kvet llapotainak
hasznossgban ppen most nagy mdosts trtnt. Ehhez hasonl heurisztikk segtsgvel a kzelt ADPalgoritmusok rendszerint nagyjbl ugyanolyan gyorsan kpesek tanulni, mint a teljes ADP, ha pusztn a tant
szekvencik szmt nzzk. Viszont tbb nagysgrenddel hatkonyabbak lehetnek, ha a szmtsi ignyt
vizsgljuk (lsd 21.3. feladat). Ezltal lehetv vlik szmukra olyan llapotterek vizsglata is, amelyek messze
tl nagyok a teljes ADP-nek. A kzelt ADP-algoritmusoknak tovbbi elnye, hogy egy j krnyezet
tanulsnak korai fzisban a T krnyezeti modell gyakran olyan tvol van a helyestl, hogy nincs sok rtelme
egy azzal pontosan konzisztens hasznossgfggvnyt kiszmtani. A kzelt algoritmus hasznlhat olyan
minimlis mret mdostst, amely cskken annak mentn, ahogy a krnyezeti modell egyre pontosabb vlik.
Ez elkerlhetv teszi a nagyon hossz rtkitercikat, amelyek a tanuls korai szakaszban azrt lpnek fel,
mert nagy vltozsok trtnnek a modellben.
679
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
A passzv tanul gensnek rgztett stratgija van, ez hatrozza meg a viselkedst. Az aktv gensnek viszont
el kell dntenie, hogy melyik cselekvst vlassza. Vegyk elszr az adaptv dinamikus programozs alapjn
tanul genst, s nzzk meg azt, hogyan kell mdostani, hogy ezt az j lehetsget kezelni tudja.
Elszr is az gensnek nem csupn egy rgztett stratgia modelljt kell megtanulnia, hanem egy teljes modellt,
amibe az sszes cselekvsnek lehetsges eredmnyeihez tartoz valsznsgek is beletartoznak. Erre a
PASSZV-ADP-GENS esetn alkalmazott egyszer tanulsi eljrs is kivlan alkalmas. Ezek utn figyelembe
kell vennnk, hogy az gens vlaszthat a cselekvsek kztt. A megtanuland hasznossgok azok, amelyeket az
optimlis stratgia definil. Ezek a hasznossgok megfelelnek a 2.1. szakasz - Az llapotok hasznossga rszben
kzlt Bellman-egyenletnek, amit itt megismtlnk:
A 17. fejezetben kzlt rtkitercis vagy stratgiaitercis algoritmusok segtsgvel ezek az egyenletek
megoldhatk az U hasznossgfggvnyre nzve. A vgs krds az, hogy mit csinljunk az egyes lpsekben.
Az egyik lehetsg, hogy a megtanult modell alapjn nyert optimlis U hasznossgfggvny alapjn az gens
meghatroz egy egy lpsre elretekint optimlis cselekvst annak rdekben, hogy maximlja a vrhat
hasznossgot. A msik lehetsg, hogy ha stratgiaitercit hasznlt, akkor az optimlis stratgia mr
rendelkezsre ll, gy gondolkods nlkl csak vgre kell hajtania az optimlis stratgia ltal javasolt
cselekvst. A krds az, hogy valban vgre kell-e hajtania?
3.1. Felfedezs
A 21.6. bra bemutatja annak a ksrletsorozatnak az eredmnyt, amely sorn az ADP-gens az egyes lpsek
sorn tanult optimlis stratgia ltal javasolt cselekvst kveti. Lthat, hogy az gens nem tanulja meg sem a
helyes hasznossgrtkeket, sem az igazi optimlis stratgit! Ehelyett a 39-edik ksrletnl megtall egy
stratgit, amely a +1 jutalomhoz vezet az als (2,1), (3,1), (3,2), (3,3) ton (lsd 21.6. bra). Ezek utn
kisebb vltoztatsokkal gyjti a tapasztalatokat, s a 276-ik ksrlettl kezdve mereven ragaszkodik ehhez a
stratgihoz, gy soha nem tanulja meg a tbbi llapot hasznossgt, s soha nem tall r a valban optimlis
tra a (1,2), (1,3), (2,3) llapotokon keresztl. Ezt moh gensnek (greedy agent) nevezzk. Ismtelt ksrletek
azt mutattk, hogy a moh gens ebben a krnyezetben nagyon ritkn tallja meg az optimlis stratgit, s
idnknt borzalmas stratgikhoz konvergl.
Hogyan trtnhet meg, hogy optimlis cselekvseket vlasztva szuboptimlis eredmnyhez jutunk? A vlasz
abban rejlik, hogy a megtanult modell nem azonos az igazi krnyezettel, teht az, ami optimlis a megtanult
modellben, szuboptimlis lehet az igazi krnyezetben. Sajnlatos mdon az gens nem tudja, hogy milyen a
valdi krnyezet, gy nem kpes az igazi krnyezetre nzve optimlis cselekvst meghatrozni. Mit kell akkor
tennnk?
680
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
Amit a moh gens nem vett figyelembe, az az, hogy a cselekvsnek tbb funkcija is van annl, mint hogy a
jelenleg megtanult modell alapjn jutalmat hozzon, ezenfell hozzjrul az igazi modell megismershez is a
nyert szlelseken keresztl. A modell javtsa viszont azt eredmnyezheti, hogy az gens tbb jutalomhoz jut a
jvben.3 Ennek megfelelen az gensnek kompromisszumot kell ktnie a kihasznls (exploitation) a
jelenlegi hasznossgbecslsben tkrztt modell alapjn trtn jutalom maximalizls s a felfedezs
(exploration) kztt, ez utbbi a hossz tv eredmnyessget szolglja. Ha csupn a kihasznlsra tr, akkor
azt kockztatja, hogy beragad valamilyen megszokott kerkvgsba. Ha pedig csak a felfedezssel trdik, hogy
tudst bvtse, de soha nem lteti t a tudst a gyakorlatba nem hoz semmilyen hasznot. A val letben
llandan dntennk kell, hogy folytassuk-e knyelmes letnket, vagy vgjunk neki az ismeretlennek, htha
egy j s jobb letet fedeznk fel. Minl tbb mindent rtnk, annl kevesebb felfedezsre van szksgnk.
Tudunk-e ennl kicsit preczebbek lenni? Van egyltaln optimlis felfedezsi stratgia? Kiderlt, hogy ezt a
krdst a statisztikus dntselmlet egy rszterlete az n. rabl problma (bandit problem) kapcsn nagy
mlysgben trgyalta (lsd a bekeretezett rszt).
Br a rablk problmjt rendkvl nehz pontosan megoldani gy, hogy egy optimlis felfedezsi stratgit
nyerjnk, azonban kszthet egy sszer terv, ami vgl az gens optimlis viselkedshez vezet. Minden ilyen
eljrs a vgtelen felfedezs hatrn lehet moh (VFHM) (greedy in the limit of infinite exploration, GLIE).
Egy VFHM-sma alapjn mkd gensnek korltlan szmban ki kell prblnia minden cselekvst az sszes
llapotban. Ezltal kerli el annak veszlyt, hogy egy szokatlanul rossz kimenetel sorozat miatt vges (nem
nulla) valsznsggel nem tall meg egy optimlis cselekvst. Egy ilyen terv alapjn mkd ADP-gens vgl
megtanulja az igazi krnyezeti modellt. Egy VFHM-tervnek vgl mohv kell vlnia, gy az gens cselekvsei
optimliss vlnak a megtanult (azaz itt az igazi) modellre nzve.
Fontos
Rablk s felfedezs
Las Vegasban a flkar rabl egy pnzbedobs jtkautomata. A jtkos bedob egy rmt, meghzza a
kart, s elveszi a nyeremnyt (ha nyer). Egy n kar rablnak (n-armed bandit) n karja van. A
jtkosnak minden rme bedobsakor vlasztania kell, hogy melyik kart hzza meg azt, amelyik
eddig a legjobban fizetett, vagy taln egy olyat, amelyet mg nem prblt?
Az n kar rabl problma a vilg sok, ltfontossg terletn szmos vals feladat formlis
modelljeknt szolglhat, mint pldul az MI kutats-fejleszts ves kltsgvetsnek kialaktsa.
Mindegyik kar egy cselekvsnek felel meg (mint pldul 400 milli forint elklntse MI-tanknyvek
fejlesztsre), s a kar meghzsval jr nyeremny a cselekvs vlasztsa esetn vrhat haszonnak
felel meg (esetnkben risi haszon vrhat). Az ismeretlen terlet feltrsa akr egy j kutatsrl,
akr egy j zletkzpontrl van sz kockzatos, drga, bizonytalan haszonnal jr; msrszt ha
egyltaln nem kutatunk, akkor soha nem fogunk semmilyen rtkes cselekvst felfedezni.
681
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
Ahhoz, hogy a rabl problmt megfelelen formalizljuk, pontosan meg kell hatroznunk, hogy mit
rtnk optimlis viselkedsen. Az irodalomban tallhat legtbb definci azt felttelezi, hogy a cl az
gens lettartama alatt elrhet sszes jutalom vrhat rtknek maximalizlsa. Ezek a defincik
megkvnjk, hogy vrhat rtket kpezznk egyrszt az sszes lehetsges vilg felett, amelybe csak
kerlhet az gens, msrszt brmelyik adott vilg minden egyes lehetsges cselekvsi szekvencija
fltt. Itt a vilgot a T(s, a, s') llapottmenet-modell definilja. Teht ahhoz, hogy az gens
optimlisan cselekedjk, szksge van a lehetsges modellek a priori eloszlsra. Ezen az ton
rendszerint teljesen kezelhetetlen optimalizcis problmkhoz jutunk.
Nhny esetben azonban pldul amikor az egyes gpek nyeremnyei fggetlenek, s lertkelt
jutalmakat hasznlunk minden egyes jtkgpre kiszmthat az gynevezett Gittins-index (Gittins,
1989). Az index csak annak fggvnye, hogy hnyszor vlasztottuk a gpet, s eddig mennyit fizetett
ki. Az index azt jelzi minden egyes gpre, hogy mennyire ri meg tovbbi pnzt bedobnunk, s a
vrhat kifizetsen s az informci vrhat rtkn alapul. A legnagyobb index gp vlasztsa az
optimlis felfedezsi stratgia. Sajnlatos mdon eddig mg nem sikerlt megtallni annak a mdjt,
hogy hogyan kell a Gittins-indexet szekvencilis dntsi problmkra kiterjeszteni.
Az n kar rabl elmlet felhasznlhat arra, hogy bizonytsuk a genetikus algoritmusok szelekcis
stratgijnak sszersgt (lsd 4. fejezet). Tekintsnk az n kar rabl problmban minden egyes kart
egy lehetsges gnfzrnek, tovbb a pnz bedobsa ennl a karnl feleljen meg ezen gnek
reprodukcijnak. Ebben az esetben a genetikus algoritmus optimlisan osztja szt a pnzt akkor, ha
adott a fggetlensgi felttelezsek egy megfelel halmaza.
Szmos VFHM-sma ismert; az egyik legegyszerbb, ha az gens az id 1/t rszben vletlen cselekvst
vlaszt, egybknt pedig moh stratgit kvet. Tny, hogy ez vgl optimlis stratgihoz vezet, de idnknt
rendkvl lassan konvergl. Egy rtelmesebb megkzelts, ha az gens nmi slyt ad azoknak a
cselekvseknek, amelyeket nem hasznlt mg gyakran, mikzben igyekszik elkerlni azokat, amelyeknek a
hasznossgt kicsinek hiszi. Ezt meg tudjuk valstani gy, ha gy mdostjuk a (21.4) knyszeregyenletet,
hogy nagyobb hasznossgot tulajdontson a relatve kiprblatlan llapot-cselekvs proknak. Lnyegben egy
optimista priort hoz ltre, az gens kezdetben gy viselkedik, mintha hatalmas jutalmak lennnek sztszrva a
helysznen. Jellje U+(s) az s llapot hasznossgnak (teht a htralev jutalom vrhat rtknek) optimista
becslst, N(a, s) pedig azt a szmot, ahnyszor az s llapotban az a cselekvst vlasztottuk. Tegyk fel, hogy az
ADP-tanulst vgz gens rtkitercit vgez, ez esetben a frisstsi egyenletet [(17.6) egyenlet] t kell rnunk
gy, hogy az az optimista becslst tartalmazza. A kvetkez sszefggs ezt megvalstja:
Itt f (u, n) az gynevezett felfedezsi fggvny (exploration function). Ez hatrozza meg a mohsg (a magas
u rtkek preferencija) s a kvncsisg (az alacsony n rtkek preferencija cselekvsek, amelyeket mg
nem alkalmaztunk nagyon gyakran) kztti kompromisszumot. Az f (u, n) fggvnynek u-ban nvekvnek, nben cskkennek kell lennie. Nyilvnvalan sok lehetsges fggvny megfelel ennek a felttelnek. Egy
klnsen egyszer fggvnydefinci:
ahol R+ a tetszleges llapotban kaphat legnagyobb jutalom optimista becslse, mg Ne egy rgztett paramter.
Ennek alkalmazsval az gens minden llapot-cselekvs prt legalbb Ne alkalommal kiprbl.
Az, hogy a (21.5) egyenlet jobb oldaln nem U, hanem U+ szerepel, nagyon fontos. Ahogy a felfedezs folyik, a
startllapot krnyki llapotok s cselekvsek j nhnyszor kiprblsra kerlhetnek. Ha U-t a pesszimistbb
becslst hasznltuk volna, akkor az gens hamar elveszthetn a szabad terletek felfedezse irnti vonzalmt.
Az U+ szerepeltetse azt jelenti, hogy a felfedezshez kapcsolt jutalom visszaterjed a felfedezetlen terlet
hatrrl. gy nem csupn a szokatlan cselekvseket preferljuk, hanem a felrtkeljk azokat a cselekvseket,
amelyek a felfedezetlen terletek fel fogjk vinni az genst. Ennek a felfedezsi stratginak a hatsa jl lthat
a 21.7. brn, gyors konvergencit ltunk az optimlis teljestmnyhez, ellenttben a moh gensnl ltottakkal.
Az optimlishoz nagyon kzeli stratgit tall mindssze 18 ksrlet utn. Vegyk szre, hogy maguk a
hasznossgrtk-becslsek nem konverglnak ilyen gyorsan. Ennek az az oka, hogy az gens meglehetsen
682
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
hamar felhagy az llapottr jutalmat nem eredmnyez rszeinek felfedezsvel, oda mr csak vletlenszeren
tved. Mindamellett teljesen sszer az gens rszrl, hogy nem sokat trdik azon llapotok hasznossgnak
pontos rtkvel, amelyekrl tudja, hogy nemkvnatosak s elkerlhetk.
Fontos
A Q-fggvny gy tnhet, mintha csupn a hasznossginformci trolsnak egy eltr mdja lenne,
de van egy nagyon fontos tulajdonsga: egy Q-fggvnyt tanul IK- gensnek nincs szksge sem a
tanuls, sem a cselekvs kivlaszts modelljre. Ezrt a Q-tanulst modellmentes (model-free)
mdszernek is nevezik. ppgy, mint a hasznossgoknl, felrhatunk egy egyenslyi egyenletet,
amelyet a korrekt Q-rtkeknek ki kell elgtenik:
683
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
Az ADP-tanulst vgz genssel azonos mdon itt is felhasznlhatjuk ezt az egyenletet egy itercis
eljrsban arra, hogy egy becslt modell alapjn pontos Q-rtkeket szmoljunk. Ez viszont azt
kvnn meg, hogy a modellt is megtanuljuk, hiszen az egyenlet hasznlja a T(s, a, s')-t. Msrszrl
viszont az IK-megkzelts nem ignyel modellt. gy a Q-rtkekre vonatkoz IK frisstsi
sszefggs:
amely mindig kiszmtsra kerl, amikor az s llapotban az a cselekvst vlasztottuk, amely az s'
llapotba vitt.
A 21.8. bra mutatja be az IK-mdszert hasznl, felfedez Q-tanul gens teljes programjt. Vegyk szre,
hogy ugyanazt az f felfedezsi fggvnyt hasznlja, mint amit a felfedez ADP-gens is hasznlt ezrt van
szksg a vgrehajtott cselekvsek gyakorisgi statisztikira (az N tblra). Ha egy egyszerbb felfedezsi
stratgit hasznlnnk mondjuk a lpsek egy rszben vletlenszer mkdst iktatva be, ahol ez rszarny
az idvel cskken , akkor mellzhetnnk ezt a statisztikt.
A Q-tanul gens megtanulja a 4 3-as vilgra az optimlis stratgit, de ezt sokkal lassabban teszi, mint az
ADP-gens. Ennek oka, hogy az IK nem knyszert modellje alapjn konzisztencit az rtkekre. Ez az
sszehasonlts felvet egy ltalnos krdst: mi a jobb: egy modellt s egy hasznossgfggvnyt tanulni, vagy
egy cselekvsrtkfggvnyt? Ms szavakkal, mi a legjobb mdja egy gensfggvny reprezentlsnak? Ez a
mestersges intelligencia alapjait rint krds. Mint az 1. fejezetben kijelentettk, az MI legnagyobb rszben
kulcsfontossg trtneti rksg a (gyakran ki nem mondott) ragaszkods a tudsalap (knowledge-based)
megkzeltshez. Ez vezet ahhoz a feltevshez, hogy az gensfggvny reprezentcijnak legjobb mdja, ha
valamilyen szempontbl az genst krlvev krnyezet modelljt ptjk meg.
21.8. bra - Egy felfedez Q-tanul gens. Egy aktv tanul, amely megtanulja minden
cselekvsnek minden egyes llapotban a Q(a, s) rtkt. Ugyanazt az f felfedezsi
fggvnyt hasznlja, amelyet a felfedez ADP-gens is hasznlt, de elkerli az
llapottmenet-modell tanulst, mivel az llapot Q-rtkt kzvetlenl a szomszdos
llapotok Q-rtkeihez tudja kapcsolni.
Nhny kutat ugyanakkor mind az MI-kzssgen bell, mind azon kvl azt lltja, hogy a modellmentes
mdszerek, mint pldul a Q-tanuls lte azt mutatja, hogy a tudsalap megkzelts nem szksges.
Mindamellett nem sok egyb van e krds eldntsre, mint az intucink. A mi intucink szerint, ahogy a
krnyezet komplexebb vlik, a tudsalap megkzelts elnyei egyre nyilvnvalbb vlnak. Ez mg a
jtkokban mint a sakk, a dmajtk s az ostblajtk (lsd kvetkez alfejezet) is gy jelentkezik, a
modellalap kirtkel fggvnyek tanulsra fordtott erfesztsek tbb sikert hoztak, mint a Q-tanul
mdszerek.
Megerstses tanuls
Fontos
A fggvnyapproximci tulajdonsgai lehetv teszik, hogy praktikusan felhasznlhat legyen nagy
llapotterek hasznossgfggvnyeinek reprezentlsra, de nem ez az alapvet elnyk. A
fggvnyapproximtorokkal elrt tmrts lehetv teszi a tanul gens szmra az ltalnostst
azokrl az llapotokrl amelyeket bejrt, azokra az llapotokra, amelyeket nem jrt be. Azaz a
fggvnyapproximci legfontosabb aspektusa nem az, hogy kevesebb helyet ignyel, hanem az, hogy
lehetv teszi az induktv ltalnostst a bemeneti llapottrben. Hogy nmi fogalmat alkothassunk
ennek a hatsnak az erejrl: a lehetsges ostblajtk llapotok kzl csupn minden 10 44-edik
llapotnak a vizsglata alapjn megtanulhat olyan hasznossgfggvny, amely kpess tehet egy
programot, hogy olyan jl jtsszon, mint egy ember (Tesauro, 1992).
Az remnek termszetesen van msik oldala is: lehet, hogy a kivlasztott hipotzistrben egyltaln nincs olyan
fggvny, amely kielgten approximln az igazi hasznossgfggvnyt. Mint az induktv tanulsnl minden
esetben, itt is kompromisszum van a hipotzistr mrete s a fggvny megtanulshoz szksges id kztt.
Egy nagyobb hipotzistr valsznbb teszi, hogy j approximcit lehet tallni, de azt is jelenti, hogy a
konvergencia valsznleg lassabb lesz.
Kezdjk a legegyszerbb esettel, a kzvetlen hasznossgbecslssel (lsd 21.2. alfejezet).
Fggvnyapproximci esetn ez nem ms, mint a felgyelt tanuls (supervised learning) egy esete. Tegyk
fel pldul, hogy a 4 3 vilg hasznossgrtkeit egy egyszer lineris fggvnnyel reprezentljuk. A
ngyzetek jellemzi egyszeren az x s y koordintik, teht:
Tudjuk, hogy az igazi hasznossgfggvny reprezentlhat egy- vagy ktoldalnyi Lisp, Java vagy C++ kddal. Azaz reprezentlhat egy
programmal, ami pontosan oldja meg a jtkot, valahnyszor meghvjuk. Mi csak olyan fggvnyapproximtorokban vagyunk rdekeltek,
amelyek sszer szmtsi mennyisget vgeznek. Valjban jobb lehet, ha egy nagyon egyszer fggvnyapproximtort tanulunk meg, s
kombinljuk valamilyen lpsszm elretekint keresssel. A szksges kompromisszumok mindamellett egyelre nem jl ismertek.
4
685
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
Megerstses tanuls esetn jobbnak tnik online tanulst alkalmazni, amely minden egyes ksrlet utn frissti
a paramtereket. Tegyk fel, hogy lefuttatunk egy ksrletet, s a teljes jutalom (1, 1)-bl indulva 0,4. Ez arra
utal, hogy az
jelenlegi rtk tl nagy, s cskkenteni kell. Hogyan kell a paramtereket
mdostani, hogy ezt elrjk? ppgy, mint a neurlis hl tanulsnl, egy hibafggvnyt runk fel, s felrjuk a
paramterekre vonatkoz gradienst. Ha uj(s) a j-edik ksrlet sorn az s llapotbl kiindulva gyjttt teljes
megfigyelt jutalom, akkor a hibt a jsolt s a tnyleges teljes jutalom ngyzetnek klnbsgeknt
(tulajdonkppen annak feleknt) definiljk:
. Az egyes i paramterek
vltozsnak hatsra a hiba vltozsnak sebessgt a Ej/i adja meg. gy, ha a paramtert abban az irnyba
akarjuk vltoztatni, hogy a hibt cskkentse, akkor azt akarjuk, hogy:
Ezt WidrowHoff-szablynak (Widrow-Hoff rule) vagy delta-szablynak (delta rule) nevezzk, s az online
legkisebb ngyzetes hibra vonatkozik. A (21.9) egyenletben felrt lineris fggvnyapproximtorra a kvetkez
hrom egyszer frisstsi szablyt kapjuk:
Alkalmazhatjuk ezeket a szablyokat arra az esetre, amikor U(1,1) = 0,8 s uj(1, 1) = 0,4. Ekkor 0, 1 s 2
mindegyike 0,4-val cskken, ami mind cskkenti az (1, 1)-beli hibt. Vegyk szre, hogy a i-k vltoztatsa az
sszes tbbi llapotra is megvltoztatja U rtkt! Ezt rtettk azon, amit mondtunk: a fggvnyapproximci
lehetv teszi a megerstses tanulst vgznek, hogy ltalnostson a tapasztalataibl.
Azt vrjuk, hogy az gens gyorsabban fog tanulni, ha fggvnyapproximtort hasznl, feltve, hogy a
hipotzistr nem tl nagy, de van benne nhny olyan fggvny, amely kielgten illeszkedik az igazi
hasznossgfggvnyre. A 21.7. feladatban azt vrjuk az olvastl, hogy rtkelje a kzvetlen
hasznossgbecslst mind a fggvnyapproximci felhasznlsval, mind anlkl. A 4 3-as vilgban a javuls
rzkelhet, de nem drmai, mivel nagyon kicsi az llapottr, amivel dolgozni kell. A javuls sokkal nagyobb a
10 10-es vilgban, ha +1 jutalom van a (10, 10) mezn. Ez a vilg jl illeszthet a lineris
hasznossgfggvnyhez, mivel az igazi hasznossgfggvny sima s kzel lineris (lsd 21.10. feladat). Ha a
jutalmat az (5, 5) mezre tesszk, akkor az igazi hasznossgfggvny piramis jelleg, s a (21.9) egyenletben
felvett fggvnyapproximtor sznalmas kudarcot vall. Mindamellett nem veszett el minden! Emlkezznk
vissza, hogy a lineris fggvnyapproximcinl az szmt, hogy a fggvny paramtereiben legyen lineris a
hasznlt tulajdonsgok nmagukban az llapotvltozk tetszleges nemlineris fggvnyei lehetnek. Teht
hasznlhatunk egy
Ugyanilyen jl alkalmazhatjuk ezeket az elveket az idbeli klnbsg alapjn tanulkra is. Mindssze annyit
kell tennnk, hogy a paramtereket gy mdostjuk, hogy az egymsra kvetkez llapotok idbeli klnbsgt
cskkenteni prbljuk. A (21.3) s (21.8) IK- s Q-tanulsi egyenleteink j vltozata:
a hasznossgfggvnyre, s
686
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
A hasznossgfggvnyek kzti tvolsg defincija csak technikai krds, lsd (Tsitsiklis s Van Roy, 1997).
687
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
A hres rd-egyenslyozsi (cart-pole) feladat, amelyet inverz ingnak (inverted pendulum) is neveznek, a
21.9. brn lthat. A feladat a kocsi x pozcijnak vezrlse gy, hogy a rd nagyjbl flfel lljon ( /2),
mikzben a kocsi a plya kijellt hatrai kztt marad. A megerstses tanuls s a szablyozselmlet
terletn tbb mint 2000 cikket publikltak errl a ltszlag egyszer feladatrl. A rd-egyenslyozsi problma
annyiban klnbzik az eddigiekben trgyaltaktl, hogy az llapotvltozi
folytonosak. A cselekvs
ltalban diszkrt: lks jobbra vagy lks balra, az gynevezett bang-bang szablyozs (bang-bang control).
Az els ezen problma tanulst clz munkt Michie s Chambers vgezte (Michie s Chambers, 1968). Az
BOXES nev algoritmusuk mindssze 30 prblkozs utn kpes volt a rudat tbb mint egy rig egyenslyban
tartani. Radsul, sok ksbbi rendszertl eltren, a BOXES egy valdi kocsit s rudat hasznlt, nem
szimulcit. Az algoritmus elszr is kvantlta, azaz tartomnyokra (dobozokra) bontotta a ngydimenzis
llapotteret, innen jtt az algoritmus neve is. Ezek utn addig vgeztek egy-egy ksrletet, amg a rd leesett
vagy a kocsi elrte a plya vgt. Negatv megerstst rendeltek az utols llapottr-tartomnyban az utols
cselekvshez, s ezt terjesztettk vissza a megelz szekvencira. Azt talltk, hogy a kvantls akkor okoz
bizonyos problmkat, ha a berendezst ms pozcibl indtottk, mint amiket a tants sorn hasznltak, ami
arra utal, hogy az ltalnosts nem volt tkletes. Jobb ltalnostkpessg s gyorsabb tanuls rhet el, ha
egy olyan algoritmust hasznlunk, amely adaptvan osztja rszekre az llapotteret, a jutalom megfigyelt
vltozsainak megfelelen. Manapsg egy hromszoros invertlt inga egyenslyozsa kznsges feladatnak
szmt ez mr a legtbb ember gyessgt messze meghaladja.
5. Stratgiakeress
688
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
A megerstses tanulssal kapcsolatos, utols ltalunk trgyalt megkzelts stratgiakeress (policy search)
nven ismert. Bizonyos rtelemben a stratgiakeress a legegyszerbb a fejezet sszes mdszere kzt. Az
alaptlet annyi, hogy engedjk vltozni a stratgit, amg javul, s utna lltsuk le a vltozst.
A vizsglatot kezdjk magval a stratgival. Emlkezznk vissza, hogy a stratgia egy olyan fggvny,
amely llapotokat kpez le cselekvsekre. Mi elssorban olyan paramterezet stratgik vizsglatban
vagyunk rdekeltek, amelyeknek sokkal kevesebb paramtere van, mint ahny llapot tallhat az llapottrben
(ppgy, mint az elz alfejezetben). Pldul paramterezett Q-fggvnyekkel reprezentlhatjuk a stratgit,
egy-egy Q-fggvnyt rendelve minden cselekvshez, s azt a cselekvst vlasztjuk, amely a legnagyobb jsolt
rtket adja:
Fontos
Minden egyes Q-fggvny lehet a paramterek lineris fggvnye, mint a (21.9) egyenletben, vagy
lehet nemlineris fggvny, mint pldul egy neurlis hl. A stratgiakeress ezek utn a
paramtereket vltoztatja oly mdon, hogy javtsa a stratgit. Vegyk szre, hogy ha a stratgit Qfggvnyekkel reprezentljuk, akkor a stratgiakeress egy Q-fggvny tanulsi eljrst eredmnyez.
Ez a folyamat azonban nem azonos a Q-tanulssal! A fggvnyapproximcit hasznl Q-tanulsban
az algoritmus egy olyan -t keres, amelyre a
kzel van Q*-hoz, az optimlis Q-fggvnyhez. A
stratgiakeress ezzel szemben olyan -t keres, amely j mkdst eredmnyez, az eredmnyl kapott
rtkek alapveten eltrhetnek.6 Egy msik nyilvnval plda a kt dolog klnbsgre az az eset,
amikor a (s) stratgit gy szmtjuk, hogy 10 lps mlysgben elretekint keresst vgznk egy
kzelt
hasznossgfggvny alapjn. A j eredmnyt ad messze lehet attl, amely az
igazi hasznossgfggvnyhez hasonlv teszi.
-t az
A (21.13) egyenletben bemutatott stratgiareprezentci egyik problmja, hogy diszkrt cselekvsek esetn a
stratgia a paramterek nemfolytonos fggvnye.7 Azaz lesznek olyan rtkek, amelyeknl vgtelen kis
vltozs a -ban azt eredmnyezi, hogy a stratgia egyik cselekvsrl a msikra vlt. Ez azt is jelenti, hogy a
stratgia rtke is vltozhat nemfolytonos mdon, ami nehzz teszi a gradiensalap eljrsok alkalmazst.
Emiatt a stratgiakeressi eljrsok gyakran hasznljk a (s, a) sztochasz-tikus stratgia (stochastic policy)
reprezentcit, amely az s llapotban az a cselekvs vlasztsnak valsznsgt specifiklja. Egy npszer
reprezentci a szoftmax fggvny (softmax function):
A szoftmax fggvny kzel determinisztikuss vlik, ha az egyik cselekvs sokkal jobb, mint a tbbi, de mindig
differencilhat szerint; gy a stratgia rtke (amely folytonos mdon fgg a cselekvsvlasztsi
valsznsgtl) differencilhat fggvnye lesz -nak.
Nzznk most mdszereket a stratgia javtsra. Kezdjk a legegyszerbb esettel: determinisztikus stratgia,
determinisztikus krnyezetben. Ebben az esetben a stratgia rtkelse trivilis: egyszeren vgrehajtjuk a
stratgit, s megfigyeljk az sszegyjttt jutalmat, ez adja szmunkra a stratgia rtkt (policy value), ()t. A stratgia javtsa ezek utn egy standard optimalizcis problma, ilyeneket a 4. fejezetben trgyaltunk.
Kvethetjk a stratgiagradiens (policy gradient) vektort, ()-t, feltve, hogy () differencilhat. Msik
lehetsg, ha az empirikus gradienst (empirical gradient) kvetjk hegymsz mdszerrel azaz kirtkeljk
a stratgit minden egyes paramter kis megvltozsa esetre. A szoksos felttelek esetn ez a stratgiatr egy
loklis optimumhoz fog konverglni.
Ha a krnyezet (vagy a stratgia) sztochasztikus, akkor a helyzet nehezebb vlik. Tegyk fel, hogy hegymsz
mdszert prblunk alkalmazni, ami azt kvnja, hogy sszehasonltsuk ()-t ( + )-val valamilyen kis
esetn. Az a problma, hogy a teljes jutalom nagyon nagyokat vltozhat ksrletrl ksrletre, gy a kisszm
ksrletbl szmtott stratgiartk nagyon megbzhatatlan lesz kt ilyen becsls sszehasonltsa pedig mg
6
7
Trivilis, hogy a
kzelt Q-fggvny optimlis teljestmnyt ad, br egyltaln nincs kzel Q*-hoz.
Folytonos cselekvsi terekre a stratgia a paramterek sima fggvnye lehet.
689
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
megbzhatatlanabb. Egy lehetsges megolds, ha egyszeren sok ksrletet futtatunk le, s a minta variancjval
mrjk, hogy elegend ksrletet futtattunk-e mr ahhoz, hogy megbzhatan jelezni tudjuk a () javtsnak
irnyt. Sajnlatos mdon ez sok vals problma esetn nem praktikus, mert az egyes ksrletek drgk,
idignyesek s esetleg veszlyesek lehetnek.
A (s, a) sztochasztikus stratgia esetn lehetsgnk van arra, hogy a -ban vgrehajtott ksrletek eredmnyei
alapjn a () gradiens torztatlan becslst lltsuk el -ban. Az egyszersg kedvrt a becslst arra az
egyszer esetre vezetjk le, amikor nem szekvencilis krnyezetben kzvetlenl az s0 startllapotbeli cselekvs
utn megkapjuk a jutalmat. Ebben az esetben a stratgiartk egyszeren a jutalom vrhat rtke, teht:
Most egy egyszer trkkt alkalmazunk, hogy ezt az sszegzst approximlni tudjuk a (s, a) ltal
meghatrozott valsznsg-eloszlsbl generlt mintkkal. Tegyk fel, hogy sszesen N ksrletnk van, s a jedik ksrletben az aj cselekvst vlasztottuk. Ekkor
Teht a stratgia igazi gradienst egy szummval kzeltettk, ahol a tagok az egyes ksrletek
cselekvsvlasztsi valsznsgeinek gradienst tartalmazzk. A szekvencilis esetre ez a kvetkezkpp
ltalnosthat:
minden egyes bejrt s llapotra. Itt aj a j-edik ksrlet sorn az s llapotban vlasztott cselekvs, s Rj(s) a j-edik
ksrlet sorn az s llapotbl kiindulva gyjttt sszes jutalom. Az eredmnyl kapott algoritmust REINFORCEnak neveztk el (Williams, 1992). Rendszerint sokkal hatkonyabb, mint a minden egyes -ban sok ksrletet
hasznl hegymsz eljrs. Viszont sajnos mg mindig sokkal lassabb annl, mint amire szksgnk lenne.
Fontos
Vizsgljuk a kvetkez feladatot: adott kt blackjack8 program, dntsk el, hogy melyik a jobb! Egyik
lehetsg, ha egy kzs bank ellen jtszatjuk ket egy adott szm krtyaleosztsban, s megnzzk,
hogy melyik nyert tbbet. Ezzel az a problma mint lttuk , hogy mindegyik program nyeresgei
nagy fluktucit fognak mutatni annak fggvnyben, hogy milyen lapokat kapott. Egy kzenfekv
megolds erre, ha elre generlunk egy sor leosztst, egy leosztshalmazt. Ezzel elkerljk a
klnbz krtyaleosztsok okozta mrsi hibt. Ez a PEGASUS algoritmus tletnek alapja (Ng s
Jordan, 2000). Az algoritmus olyan terleteken alkalmazhat, ahol rendelkezsnkre ll egy
szimultor, ezltal a vletlen ksrlet kimenetelek megismtelhetv vlnak. Az algoritmus N
vletlen szmsorozatot generl elre, mindegyik felhasznlhat arra, hogy egy tetszleges stratgia
alapjn ksrletet futtassunk vele. A stratgiakeresst gy hajtjuk vgre, hogy mindegyik
stratgiajelltet az alapjn rtkelnk, hogy ugyanazt a vletlen sorozat halmazt hasznlja a ksrletek
kimeneti rtkeinek meghatrozshoz. Megmutathat, hogy az sszes stratgia rtknek j
becslshez szksges vletlen sorozatok szma csak a stratgiatr komplexitstl fgg, s egyltaln
nem fgg a mgttes terlet komplexitstl. A PEGASUS algoritmussal szmos terleten (pldul az
autonm helikoptervezets terletn) tbb hatkony stratgit fejlesztettek ki (lsd 21.10. bra).
21.10. bra - Idben eltolt kpek egymsra msolsa tjn kapott ered kp, amelyen
egy nagyon bonyolult krberepls orral a kr kzppontja fele manvert hajtanak
vgre. A helikoptert egy Pegasus stratgiakeres algoritmussal fejlesztett stratgival
vezrlik. Egy szimultormodellt fejlesztettek a vals helikopter egyes vezrlsi
8
690
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
6. sszefoglals
Ebben a fejezetben a megerstses tanulssal foglalkoztunk: azzal, hogy egy ismeretlen krnyezetben mkd
gens hogyan vlhat gyakorlott pusztn megfigyelsei, valamint az esetenknt kapott jutalmak
felhasznlsval. A megerstses tanuls a teljes MI-tmakr mikrovilgnak is tekinthet, amelyet azonban az
elrehalads rdekben egy sor egyszerst felttel mellett trgyaltunk. A kvetkez fontosabb
megllaptsokat tettk:
Az gens teljes felptse hatrozza meg azt, hogy milyen informcit kell megtanulni. A trgyalt hrom f
felptsi lehetsg: egyrszt a modellalap, amely a T modellt s az U hasznossgfggvnyt hasznlja;
msrszt a modell nlkli felpts, amely a Q cselekvsrtk-fggvnyt hasznlja, s a reflexszer, amely a
stratgit hasznlja.
A hasznossgrtkek hromfle megkzelts alapjn tanulhatk:
1. A kzvetlen hasznossgbecsls (direct utility estimation), amely a megfigyelt htralv jutalmat
hasznlja egy-egy llapot esetn, mint a hasznossg tanulsnak kzvetlen jellemzjt.
2. Az adaptv dinamikus programozs (ADP) (adaptive dynamic programming) megfigyelsei alapjn
egy modellt s egy jutalomfggvnyt tanul, ezek utn rtk- vagy stratgiaitercit hasznl ahhoz, hogy az
llapotok hasznossgbecslshez vagy az optimlis stratgihoz eljusson. Az ADP optimlisan hasznlja
fel a krnyezetnek a szomszdos llapotokra vonatkoz struktrjbl add loklis knyszereket.
3. Az idbeli klnbsg (IK) (temporal-difference, TD) megkzelts gy mdostja a
hasznossgbecslseket, hogy megfeleljenek az adott llapotot kvet llapotokra vonatkoz becslseknek.
Tekinthetjk egyszeren az ADP megkzelts olyan approximcijnak is, amely a tanulshoz nem
ignyel modellt. Mindamellett, ha a megtanult modellt pszeudotapasztalatok generlsra hasznljuk,
gyorsabb tanulshoz juthatunk.
A cselekvsrtk-fggvnyek vagy Q-fggvnyek ADP- vagy IK-megkzeltssel tanulhatk. IK esetn a Qtanuls sem a tanuls, sem a cselekvs kivlasztsnak fzisban nem ignyli modell hasznlatt. Ez
691
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
Megerstses tanuls
problmkban alkalmazott felfedezsi mdszerek szmos vltozatt trgyaljk (Barto s trsai, 1995). Kearns s
Singh, valamint Brafman s Tennenholtz olyan algoritmusokat rnak le (Kearns s Singh, 1998; Brafman s
Tennenholtz, 2000), amelyek ismeretlen krnyezet felfedezst vgzik, s bizonytott, hogy polinomilis id
alatt konverglnak kzel-optimlis stratgikhoz.
A megerstses tanuls terletn a fggvnyapproximci alkalmazsa Samuel munkjig vezethet vissza, aki
mind lineris, mind nemlineris kirtkel fggvnyeket alkalmazott, tovbb a tulajdonsgok ternek
cskkentsre tulajdonsgszelekcis algoritmusokat is hasznlt. A ksbbiekben bevezetett mdszerek kz
tartozik a CMAC (Cerebellar Model Articulation Controller) (Albus, 1975), amely lnyegben tlapold
loklis kernelfggvnyek sszegbl, s a Barto s trsai ltal bevezetett asszociatv neurlis hlkbl ll (Barto
s trsai, 1983). Napjainkban a neurlis hlk a legnpszerbb fggvnyapproximtorok. A legismertebb
alkalmazs az ebben a fejezetben bemutatott TD-Gammon (Tesauro, 1992, 1995). A neurlis hlkkal
megvalstott IK-tanulknak slyos problmja az, hogy hajlamosak elfelejteni korbbi tapasztalataikat. Ez
klnsen igaz azokra trrszekre, amelyeket a szakrtelmk megszerzse utn elkerlnek. Ez katasztroflis
kvetkezmnyekkel jrhat, ha helyzetek jra jelentkeznek. A pldnyalap tanuls (instance-based learning)
alkalmazsval ez a problma elkerlhet (Ormoneit s Sen, 2002; Forbes, 2002).
A fgvnyapproximcit hasznl megerstses tanuls konvergencija kimondottan technikai krds. Lineris
approximl fggvnyek alkalmazsa esetn az IK tanulsi eredmnyek folyamatosan javulnak (Sutton, 1988;
Dayan, 1992; Tsitsiklis s Van Roy, 1997), de nemlineris fggvnyek esetn szmos divergencit mutat
pldt talltak (a jelensg trgyalst lsd a (Tsitsiklis s Van Roy, 1997)-ben). Papavassiliou s Russell a
megerstses tanuls j formjt adtk (Papavassiliou s Russell, 1999), amely tetszleges struktrj
fggvnyapproximtor esetn konvergl, feltve, hogy tallhat a megfigyelt adatokra egy legjobban illeszked
approximci.
A stratgiakeressre Williams hvta fel a figyelmet (Williams, 1992), volt az, aki kifejlesztette a REINFORCE
algoritmuscsaldot. A ksbbi munkk megerstettk s ltalnostottk a stratgiakeress konvergencijra
vonatkoz eredmnyeket: (Marbach s Tsitsiklis, 1998; Sutton s trsai, 2000; Baxter s Bartlett, 2000). Ng s
Jordan (2000) alkottk meg a PEGASUS algoritmust (Ng s Jordan, 2000), br hasonl technikk mr Van Roy
PhD-disszertcijban is megtallhatk (Van Roy, 1998). Mint a fejezetben emltettk, a sztochasztikus
stratgik teljestmnye a paramtereik folytonos fggvnye, ami elsegti a gradiensalap technikk
alkalmazhatsgt. Nem ez az egyetlen elnyk: Jaakkola s trsai amellett rvelnek, hogy rszlegesen
megfigyelhet krnyezetben a sztochasztikus stratgik jobban mkdnek, mint a determinisztikusok, ha
mindkt stratgia esetn a cselekvs pusztn a jelenlegi szlelsen alapul (Jaakkola s trsai, 1995). (Ennek
egyik oka, hogy a sztochasztikus algoritmusok kevsb hajlamosak beragadni", ha valamilyen eddig mg nem
ltott akadly jelentkezik.) A 17. fejezetben rmutattunk, hogy rszlegesen megfigyelhet MDF-ekben az
optimlis stratgik inkbb a hiedelemllapot determinisztikus fggvnyei, mint az aktulis megfigyelsek.
Ennek megfelelen mg jobb eredmnyeket vrnnk, ha a 15. fejezetben trgyalt szrsi (filtering)
mdszerekkel nyomon kvetnnk a hiedelemllapot alakulst. Sajnlatos mdon a hiedelemllapot-terek
sokdimenzisak s folytonosak, s az eddigiekben nem sikerlt hatkony mdszereket kifejleszteni a
hiedelemllapotok megerstses tanulsra.
A vals krnyezetekre az is jellemz, hogy gyakran rengeteg elemi cselekvsi lpsre van szksg ahhoz, hogy
jelents jutalomhoz jussunk. Pldul ha egy robot focizik, akkor szzezer elemi lbmozdulatot is tehet, mieltt
glt l. Egy szoksos mdszer erre a jutalomalakts (reward shaping), melyet eredetileg az llatok
tantsnl alkalmaztak. Ennek rsze, hogy tovbbi jutalmakat adunk az gensnek, ha az haladst r el. A foci
esetn pldul jutalmat adhatunk, ha hozzr a labdhoz vagy a kapu fel l. Ezeket a jutalmakat rendszerint
nagyon egyszer kialaktani, s rendkvl felgyorsthatjk a tanulst, de megvan az a veszlye, hogy az gens a
tanuls sorn a pszeudojutalmak maximlst vgzi el, nem az igazi jutalmakt. A foci tanulsa esetn pldul
a labdhoz val kzelsg s a labdval val sok-sok rintkezs, a vibrls, lehet ennek az eredmnye. Ng s
trsai megmutattk, hogy az gens gy is megtanulja az optimlis stratgit, ha az F(s, a, s') pszeudojutalom
kielgti az F(s, a, s') = (s') (s) egyenletet, ahol az llapot tetszleges fggvnye (Ng s trsai, 1999).
A -t gy alkothatjuk meg, hogy az llapot valamely kvnatos vonsait tkrzze, pldul valamilyen rszcl
elrst vagy a clllapottl val tvolsgot.
Az sszetett viselkeds kialaktst hierarchikus megerstses tanulsi (hierarchical reinforcement
learning) mdszerekkel segthetjk el, amelyek tbb absztrakcis szinten igyekeznek megoldani a problmt,
a 12. fejezetben ismertetett HFH-tervksztshez (HTN planning) hasonlan. Pldul a gllvs
sztbonthat labdaszerzs, a kapu fel cselezs s lvs rszekre, s ezek mind tovbb bonthatk
alacsonyabb szint mozgsokra. Ezen a terleten Forestier s Varaiya rtek el alapvet eredmnyt (Forestier s
Varaiya, 1978). Bebizonytottk, hogy tetszleges bonyolultsg alsbb szint viselkeds egyszeren elemi
693
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
cselekvsnek tekinthet az t kivlt magasabb szint viselkeds szempontjbl (br az alsbb szint viselkeds
ltal megvalstott cselekvsek eltr idt vehetnek ignybe). Parr s Russell, Dietterich, Sutton s trsai,
valamint Andre s Russell jelen kutatsaikban erre az eredmnyre ptettek: olyan mdszereket fejlesztettek,
amelyek rszprogrammal (partial program) ltjk el az genst, ezzel viselkedst valamilyen specilis
hierarchikus struktrba szortva (Parr s Russell, 1998; Dietterich, 2000; Sutton s trsai, 2000; Andre s
Russell, 2002). A megerstses tanulst ezek utn arra hasznljk, hogy a rszprogrammal konzisztens legjobb
viselkedst tantsk. A fggvnyapproximci, a jutalomalakts s a hierarchikus megerstses tanuls
sszekombinlsa lehetv teheti, hogy nagy bonyolultsg problmk megoldst ksreljk meg a siker
remnyben.
Az irodalom ttekintshez j kiindulpontot ad Kaelbling tanulmnya (Kaelbling s trsai, 1996). A terlet kt
ttrjnk, Suttonnak s Bartnak a publikcija az architektrkra s algoritmusokra koncentrl, megmutatva,
hogy a megerstses tanuls sszekti a tanuls, a tervezs s a cselekvs elveit (Sutton s Barto, 1998).
Bertsekas s Tsitsiklis inkbb technikai rszletekkel foglalkoz munkja a dinamikus programozs s a
sztochasztikus konvergencia elmletnek precz megalapozst nyjtja (Bertsekas s Tsitsiklis, 1996). A
Machine Learning, illetve a Journal of Machine Learning Research folyiratok, tovbb az International
Conferences on Machine Learning s a Neural Information Processing Systems rendezvnyek kiadvnyai
kzlnek gyakran megerstses tanulssal foglalkoz cikkeket.
6.2. Feladatok
21.1.
Egy a 4 3-as vilghoz hasonl egyszer krnyezetben valstson meg egy passzv tanul genst!
Hasonltsa ssze a kzvetlen hasznossgbecslst, az IK-t s az ADP-t elzetesen nem ismert krnyezeti
modellek esetn! Vgezze el az sszehasonltst az optimlis stratgira s tbb, vletlen mdon generlt
stratgira! Melyikre konverglnak gyorsabban a hasznossgbecslsek? Mi trtnik, ha nveli a krnyezet
mrett? (Vizsgljon plykat akadlyokkal s azok nlkl!)
21.2.
A 17. fejezetben gy definiltuk az MDF szmra megfelel stratgit (proper policy), mint ami biztosan elri
a vgllapotot. Mutassa meg, hogy egy passzv ADP-gens kpes egy olyan llapottmenet-modell
megtanulsra, amelyre nzve stratgija nem megfelel, mg ha megfelel is az igazi MDF-re; az ilyen
modellekkel = 1 esetben az rtkmeghatrozsi lps meghisulhat! Mutassa meg, hogy ez a problma nem
jelentkezik, ha az rtkmeghatrozst csak a ksrlet vgeztvel alkalmazzuk a megtanult modellre.
21.3.
Induljon ki egy passzv ADP-gensbl, s mdostsa gy, hogy a fejezetben lert kzelt ADP-algoritmust
kapja! Kt lpsben oldja meg a feladatot:
a. ptsen fel egy prioritssort a hasznossgbecslsek mdostsra! Valahnyszor llapotmdostsra kerl, az
t megelz llapotok is potencilisan mdostandk, teht be kell lltani ket a sorba. A sor inicializlst
annak az llapotnak a felhasznlsval vgezzk, amelybl a legutols tmenet trtnt. Csak rgztett szm
mdostst engedjen meg!
b. Ksrletezzen a prioritssor rendezsnek klnbz heurisztikival, vizsglja meg a tanuls sebessgre s a
szmtsi idre gyakorolt hatsukat!
21.4.
A 21.2. alfejezetben bemutatott kzvetlen hasznossgbecslsi mdszerek elklntett vgllapotokat hasznltak
a ksrlet vgnek jelzsre. Hogyan mdosthatk vgllapottal nem rendelkez, lertkelt jutalmakat hasznl
krnyezetekre?
21.5.
Hogyan hasznlhat az rtkmeghatrozsi algoritmus gy, hogy egy U hasznossgbecsls-halmazt s egy M
becslt modellt hasznl gensnek a helyes rtkeket hasznl genshez kpesti vrhat vesztesgt szmtsa?
21.6.
694
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
Adaptlja a 2. fejezetben bemutatott porszvvilgot megerstses tanulsra! Az gens kapjon jutalmat minden
felszvott szemtrt, a helyre val visszarskor s kikapcsolskor! Megfelel szlelsekkel tegye
megfigyelhetv a vilgot! Ksrletezzen klnbz megerstses tanulst vgz gensekkel! Szksg van-e
fggvnyapproximcira a siker rdekben? Milyen approximtor mkdik erre az alkalmazsra?
21.7.
Valstson meg egy felfedez megerstses tanul genst, amely kzvetlen hasznossgbecslst vgez.
Ksztsen kt vltozatot, az egyik tblzatos reprezentcit hasznljon, a msik a (21.9) egyenlet
fggvnyapproximtort. Hasonltsa ssze teljestmnyket az albbi hrom klnbz krnyezetben:
a. A fejezetben lert 4 3-as vilg.
b. Egy 10 10-es vilg, amelyben nincsenek akadlyok, s a (10, 10) mezn van +1 jutalom.
c. Egy 10 10-es vilg, amelyben nincsenek akadlyok, s az (5, 5) mezn van +1 jutalom.
21.8.
rja fel az IK-tanuls paramterfrisstsi egyenlett a kvetkez esetre:
21.9.
Talljon ki megfelel jellemzket a sztochasztikus ngyzetrcsvilgra (a 4 3-as vilg ltalnostsa), amely
vilg tbb akadlyt s tbb (+1, illetve 1 jutalommal jellemezhet) vgllapotot tartalmaz!
21.10.
Szmtsa ki a vals hasznossgfggvnyt s az x, y fggvnyben felrhat legjobb lineris approximcit
(ppgy, mint a (21.9) egyenletben tettk) a kvetkez krnyezetekre:
a. Egy 10 10-es vilg, amelyben a (10, 10) az egyetlen +1 vgllapot mez.
b. Mint (a), de a (10, 1)-en van egy tovbbi 1 vgllapot.
c. Mint (b), de tegyen 10 vletlen mdon vlasztott mezre akadlyt.
d. Mint (b), de vegyen fel egy falat (5, 2)-tl (5, 9)-ig.
e. Mint (a), de a vgllapot legyen az (5, 5).
A cselekvsek a ngy lehetsges irnyba val determinisztikus lpsek. Minden esetben hromdimenzis
brkat hasznlva vgezze el az sszehasonltst! Mindegyik krnyezetben adjon javaslatot tovbbi olyan
tulajdonsgokra (x-en s y-on tl), amelyek javthatjk az approximcit, majd brzolja az eredmnyeket!
21.11.
Terjessze ki a standard jtkkrnyezetet (6. fejezet) gy, hogy tartalmazzon jutalomjelet is! Helyezzen kt
genst ebbe a krnyezetbe (termszetesen osztozhatnak az gensprogramon), s jtszassa egyms ellen ket!
Alkalmazza az ltalnostott IK frisstsi szablyt (21.11 egyenlet) a kirtkel fggvny frisstsre. Lehet,
hogy rdemes egy egyszer slyozott lineris kirtkel fggvnnyel kezdeni, s egy egyszer jtkkal, mint a 3
3-as amba (tic-tac-toe).
21.12.
Valstsa meg a REINFORCE s PEGASUS algoritmusokat a 4 3-as vilgra, s alkalmazza egy sajt maga ltal
vlasztott stratgiacsaldra! rtkelje az eredmnyeket!
21.13.
695
Created by XMLmind XSL-FO Converter.
Megerstses tanuls
Olvasnival. Vizsglja meg a megerstses tanuls elveinek humn, illetve llati viselkedsre val
alkalmazst!
21.14.
Olvasnival. Alkalmas absztrakt modellje-e az evolcinak a megerstses tanuls? Milyen kapcsolat van ha
van egyltaln a beptett jutalomjelek s az evolcis rtermettsg kzt?
696
Created by XMLmind XSL-FO Converter.
697
Created by XMLmind XSL-FO Converter.
Kommunikci
A fejezetben hozott pldk fordtsakor a kvetkezkppen jrtunk el: az olyan angol kifejezseket, amelyek magyarul is szemlletesek az
adott mondanival szempontjbl, magyar fordtsban adjuk meg. A kifejezsek s rszletesebb pldk tbbsgnl ez nem kvethet,
mivel a szerz az angol nyelv sajtossgaihoz illeszti a fejezet ismeretanyagnak s pldinak megfogalmazst, gy a fordts lnyegi
vltozst hozott volna a fejezet tartalmban is. Ezeken a rszeken a magyar vltozatban is meghagyjuk az eredeti angol kifejezseket,
szksg esetn rvid magyar fordtsukkal kiegsztve. A szerzk ltrehozzk az angol nyelv egy formlis rszhalmazt, amin bemutatjk a
fejezetben ismertetett mdszerek alkalmazst. Ezt is vltozatlan formban helyezzk t a magyar nyelv kiadsba. Ezen rszek magyar
fordtst sem ksztjk el, mivel a fordts a mondanival szempontjbl lnyegtelen. (A ford.)
1
698
Created by XMLmind XSL-FO Converter.
Kommunikci
kategriba tartozik. A fnvi s igei kifejezs kzbls fogalma nlkl sokkal bonyolultabb lenne
elmagyarzni, hogy mirt j mondat a the wumpus is dead s mirt nem a wumpus the dead is.
Fontos
Generlkpessg
A nyelvtani formalizmusok osztlyozhatk generlkpessgk (generative capacity) szerint:
azoknak a nyelveknek a halmaza szerint, amelyeket kpesek reprezentlni. Chomsky a nyelvtani
formalizmusok ngy osztlyt rta le, amelyek csak az tr szablyok formjban klnbznek
(Chomsky, 1957). Az osztlyok hierarchiba rendezhetk, ahol minden osztly felhasznlhat az
sszes olyan nyelv lersra, ami lerhat egy nla gyengbb osztllyal, s mg nhny tovbbi nyelvre
is. Itt most felsoroljuk a hierarchit, a legersebbel kezdve.
A rekurzvan felsorolhat nyelvtanok (recursively enumerable grammars) korltozs nlkli
szablyokat hasznlnak: az tr szablyok mindkt oldala tetszleges szm zr s nem zr
szimblumot tartalmazhat, mint pldul az A B C szably. Ezen nyelvtanok kifejezereje
megegyezik a Turing-gpvel.
A krnyezetrzkeny nyelvtanok (context-sensitive grammars) csak olyan rtelemben
korltozottak, hogy a jobb oldalnak legalbb annyi szimblumot kell tartalmaznia, mint a bal oldalnak.
A krnyezetrzkeny (krnyezetfgg) elnevezs abbl a tnybl ered, hogy egy A S B A X B
szably azt mondja, hogy egy S trhat X-re egy megelz A s egy kvet B krnyezetben. A
krnyezetrzkeny nyelvtanok lerhatnak pldul olyan nyelvet, mint az anbncn (a-k n hosszsg
sorozata, amelyet ugyanannyi b s c kvet).
A krnyezetfggetlen nyelvtanok (context-free grammars) (vagy CFG-k) esetben a bal oldal
egyetlen nem zr szimblumot tartalmaz. gy minden egyes szably megengedi a nem zr
szimblum trst a jobb oldalra tetszleges krnyezetben. A CFG-k npszerek a termszetes s
programozsi nyelvek nyelvtanai krben, br ma mr szles krben elfogadott, hogy ltezik legalbb
nhny olyan termszetes nyelv, mely tartalmaz olyan szerkezeteket, melyek nem rhatk le
krnyezetfggetlen nyelvtannal (Pullum, 1991). A krnyezetfggetlen nyelvtanok kpesek
reprezentlni anbn-t, de nem anbncn-t.
A regulris nyelvtanok (regular grammars) a legkorltozottabb osztly. Minden szablynak van
egyetlen nem zrja a bal oldaln, s egy zr szimblum a jobb oldalon, amit opcionlisan kvethet
egy nem zr. A regulris nyelvtanok a vges automatval ekvivalens erejek. Gyengn alkalmasak
programozsi nyelvek szmra, pldul nem kpesek nyit s bezr zrjelek egyenslyt ler
szerkezetek brzolsra (az anbn nyelv egy vltozata). Ehhez legkzelebb a*b* reprezentlsval
juthatnak, amely tetszleges szm a sorozatt kvet tetszleges szm b.
A hierarchiban fentebb helyezked nyelvtanoknak nagyobb a kifejezereje, de a kapcsold
algoritmusok kevsb hatkonyak. Az 1980-as vek kzepig a nyelvszek a krnyezetfggetlen s
krnyezetrzkeny nyelvtanokkal foglalkoztak. Azta nagyobb hangslyt fektetnek regulris
nyelvtanokra, amelyeket az elektronikusan elrhet szvegek mega- s gigabjtjainak gyors, mg a
kevsb teljes analzis rn is trtn feldolgozsi ignye hvott letre. Ahogy Fernando Pereira
mondta: Minl regebb leszek, annl lentebb megyek a Chomsky-hierarchin. Hogy lssuk, mit rtett
ezen, vesse ssze (Pereira s Warren, 1980; Mohri, Pereira s Riley, 2002)
Az NP, a VP s az S kategrik gynevezett nem zr szimblumok (nonterminal symbols). A nyelvtanok
tr szablyok (rewrite rules) segtsgvel definiljk a nem zr szimblumokat. Az tr szablyok
lersra a BackusNaur-formt (BNF) fogjuk tvenni, amelyet a B) fggelkben runk le az 1. szakasz - B1.
Nyelvek definilsa BackusNaur-Formban (BNF) rszben. Ezen jells szerint egy
S NP VP
szably jelentse az, hogy egy S egy tetszleges NP kategrij kifejezsbl s az azt kvet tetszleges VP
kategrij kifejezsbl ll.
Kommunikci
Egy tipikus kommunikcis epizd, amikor S beszl P lltst szeretn tadni H hallgatnak W szavakkal, ht
folyamatbl ll:
Szndk (intention). S beszl valahogy eldnti, hogy van egy P propozci, amit rdemes elmondani H
hallgatnak. A pldnkban a beszlnek az a szndka, hogy a hallgat tudomsra hozza, hogy a wumpus mr
nem l.
Ltrehozs (generation). A beszl megtervezi, hogy P propozcit hogyan alaktsa t olyan kijelentss,
amely valsznv teszi, hogy a hallgat, fogadva a kijelentst a jelenlegi szituciban, kikvetkeztetheti P
jelentst (vagy egy hozz kzelit). Ttelezzk fel, hogy a beszl kpes a kvetkez szavakat ltrehozni: The
wumpus is dead (A wumpus halott), s jelljk ezt W-vel.
Szintzis (synthesis). A beszl ltrehozza W szavak fizikai realizcijt, W'-t. Ezt teheti tintval papron,
rezgsekkel levegben vagy valamilyen ms mdiumon. A 22.1. brn egy olyan genst mutatunk, amely a 6.
szakasz - Beszdfelismers rszben definilt fonetikus bcvel lert W' hangfzr szintzist vgzi:
[thaxwahmpaxsihzdehd]. A szavak egybefolytak, ami tipikus a gyorsan beszlt nyelv esetben.
szlels (perception). H szleli a W' fizikai megvalsulst, mint W'2-t, s W2 szavakknt dekdolja. Amikor a
mdium a beszd, az szlelsi lpst beszdfelismersnek (speech recognition) nevezzk; amikor az rs,
akkor optikai karakter felismersnek (optical character recognition). Mindkett elmozdult az elvont lttl a
mindennapi elforduls irnyba a kilencvenes vekben, fknt az asztali szmtgpek jelents mrtkben
nvekv teljestmnynek ksznheten.
Analzis (analysis). H kikvetkezteti, hogy W2-nek P1, , Pn lehetsges jelentse van. Az analzist hrom f
rszre osztjuk: szintaktikai elemzsre (parsing), szemantikai rtelmezsre s pragmatikus rtelmezsre. Az
elemzs (parsing) egy bemeneti fzrhez tartoz elemzsi, ms szval levezetsi fa (parse tree) ptsnek a
folyamata, ahogy a 22.1. brn lthat. Az elemzsi fa bels csompontjai kifejezseket reprezentlnak, mg a
levelek szavakat jelkpeznek. A szemantikus rtelmezs (semantic interpretation) az a folyamat, amelynek
sorn kinyerjk egy kijelents jelentstartalmt valamilyen reprezentcis nyelven. A 22.1. brn kt lehetsges
szemantikai rtelmezst mutatunk be: azt, hogy a wumpus nem l, s azt, hogy fradt (a dead egy kznyelvi
jelentse). A tbb lehetsges rtelmezssel rendelkez kijelentseket tbbrtelmnek (ambiguous) mondjuk. A
pragmatikus rtelmezs (pragmatic interpretation) figyelembe veszi azt a tnyt, hogy ugyanazon szavaknak
ms jelentse lehet eltr helyzetekben. Mg a szintaktikai rtelmezs egy egy argumentummal, a fzrrel
700
Created by XMLmind XSL-FO Converter.
Kommunikci
rendelkez fggvny, addig a pragmatikus rtelmezs a kijelentst s annak krnyezett vagy szitucijt
figyelembe vev fggvny. A pldban a pragmatikus elemzs kt dolgot tesz: a Now konstans rtket kicserli
az S3 konstanssal, ami a jelenlegi szitucit jelenti, illetve a Wumpus-t kicserli Wumpus1-re, ami arra az
egyetlen Wumpusra utal, amelyrl tudott, hogy a barlangban van. ltalnossgban a pragmatikus elemzs a
kijelents vgs rtelmezshez sokkal tbbel jrulhat hozz; gondoljunk csak pldul arra, amikor a A
gymntra nzek elhangzik egy kszersz, illetve egy baseballjtkos szjbl. 2 A 22.7. alfejezetben ltni
fogjuk, hogy a pragmatikus elemzs segt rtelmezi az It is dead kijelentst gy, hogy a wumpus halott, ha egy
olyan szituciban vagyunk, amikor a wumpus ll a figyelem kzppontjban.
A tbbrtelmsg feloldsa (disambiguation). H kikvetkezteti, hogy S Pi-t szndkozott kzlni (ahol idelis
esetben Pi = P). A beszlk tbbsge nem szndkosan tbbrtelm, de a legtbb kijelentsnek tbb
megengedett rtelmezse van. A kommunikci azrt mkdik, mivel a hallgat elvgzi azt a munkt, hogy
rjjjn, hogy melyik az az rtelmezs, amit a beszl valsznleg kzlni akart. Vegyk szre, hogy ez az els
alkalom, amikor a valsznleg szt hasznltuk, s a tbbrtelmsg feloldsa az els eljrs, ami erteljesen
valsznsgi kvetkeztetsen alapul. Az analzis lehetsges rtelmezseket llt el; ha egynl tbb rtelmezst
tall, akkor a tbbrtelmsg feloldsa vlasztja ki a legjobbat.
Bepts (incorporation). H eldnti, hogy elhiszi Pi-t (vagy nem). Egy teljesen naiv gens mindent elhihet, amit
hall, de egy kifinomultabb gens gy kezeli a szlsaktust, mint egy Pi-t altmaszt tnyt, s nem mint annak a
megerstst.
Mindezeket sszerakva a 22.2. brn lthat gensprogramot kapjuk. Itt az gens robotszolgaknt mkdik,
amit egy gazda irnythat. A szolga minden lpsben megvlaszolja a gazda krdst, illetve vgrehajtja a
parancst, s a szolga minden, a gazda ltal kijelentett lltst elhisz. Ezenkvl megllaptst tesz az aktulis
szitucira (csak egyszer), ha nincs ms tennivalja, s megtervezi sajt akcijt, ha magra hagyjk. me, egy
tipikus prbeszd:
ROBOTSZOLGA
GAZDA
Szellt rzek.
Menj 1, 2-re!
Menj szaknak!
701
Created by XMLmind XSL-FO Converter.
Kommunikci
2.1. Az 0 szkincse
Elszr definiljuk a szkincset (lexicon), azaz a megengedett szavak listjt. A szavakat a sztrhasznlk
szmra ismers mdon csoportostjuk kategrikba, avagy beszdrszekbe: fnevek, nvmsok s nevek
dolgok elnevezsre, igk esemnyek jellsre, jelzk a fnevek mdostsra s hatrozszk az igk
mdostsra. Egyes olvask szmra kevss ismertek lehetnek a kvetkez kategrik: nvelk (articles)
(pldul a the), elljrszavak (prepositions) (pldul in) s ktszk (conjunctions) (pldul and). A 22.3.
bra mutat egy kis szkincset.
Minden egyes kategria -tal vgzdik annak jelzsre, hogy vannak ms szavak is a kategriban. Azt is meg
kell jegyeznnk azonban, hogy kt klnll ok van a szavak hinyra. A fnevek, az igk, a jelzk s a
nvmsok esetben elmletileg sem lehetsges az sszes felsorolsa. Nemcsak azrt, mert minden osztlynak
ezernyi vagy tzezernyi tagja lehet, hanem azrt is, mivel folyamatosan hozzaddnak jak, mint pldul az
MP3 vagy az anime. Ezt a ngy kategrit nyitott osztlyoknak (open classes) nevezzk. A tbbi kategrit
(nvmsok, nvelk, elljr- s ktszk) lezrt osztlyoknak (closed classes) hvjuk. Mindegyikben kevs
szm sz van (nhnytl pr tucatig), amelyek elmletileg teljesen felsorolhatk. A lezrt osztlyok
vszzadok folyamn vltoznak, nem hnapok alatt. Pldul a thee s a thou a 17. szzadban elterjedt
nvmsok voltak, hanyatlban voltak a 19. szzadban, s manapsg csak versekben s egyes rgik
dialektusban lehet tallkozni velk.
702
Created by XMLmind XSL-FO Converter.
Kommunikci
2.2. Az 0 nyelvtana
A kvetkez lps a szavak kifejezsekk trtn kombinlsa. t nem zr szimblumot fogunk hasznlni a
klnbz tpus kifejezsek definilsra: mondat (S), fnvi kifejezs (NP), igei kifejezs (VP), elljri
kifejezs (PP) s relatv klz (RelClause).3 A 22.4. bra 0 szmra mutat egy nyelvtant, minden egyes tr
szablyra pldt adva. Az 0 j angol mondatokat generlt, mint amilyenek pldul a kvetkezk:
John is in the pit
The wumpus that stinks is in 2 2
Mary is in Boston and John stinks
Sajnlatos mdon a nyelvtan tlgenerl (overgenerates) elllt olyan mondatokat, amelyek nyelvtanilag
helytelenek , mint pldul a Me go Boston s az I smell pit gold wumpus nothing east. Alul is generl
(undergenerates): sok olyan angol mondat van, amit elutast, mint pldul a I think the wumpus is smelly.
(Egy msik htrnya, hogy a nyelvtan nem nagybetvel kezdi a mondatokat, s nem rak pontot a vgkre. Ez
azrt van, mivel elssorban beszdre terveztk, s nem rsra.)
Egy relatv klz fnvi kifejezst kvet s mdost. (A klz a nyelvszetben egy alrendelt mellkmondat a ford.) Egy relatv nvmsbl
(mint a who s a that) s egy azt kvet igei kifejezsbl ll. (Egy msik tpus relatv klz a 22.12. feladatban szerepel.) Plda egy
relatv klzra a that stinks a The wumpus that stinks is in 2 2 mondatban.
3
703
Created by XMLmind XSL-FO Converter.
Kommunikci
olyan ft kell visszaadnia, amelynek gykerben S ll, levelei a the wumpus is dead s bels csompontjai az
0 nyelvtan nem zr szimblumai. A 22.1. brn lthattunk egy ilyen ft. Folytonos szvegknt a
kvetkezkppen rhatjuk:
[S: [NP: [Article: the] [Noun: wumpus]]
[VP: [Verb: is][Adjective: dead]]]
Fontos
Az elemzs tekinthet egy levezetsi fa megkeressnek folyamataknt. A keressi tr
meghatrozsnak kt szlssges (s sok kzbls) mdja van. Az egyik szerint kiindulhatunk az S
szimblumbl, s kereshetnk egy olyan ft, amely leveleiben tartalmazza a szavakat. Ez az
gynevezett fentrl lefel elemzs (top-down parsing) (mivel S-et a fa tetejre helyezzk). Msrszt
kiindulhatunk a szavakbl, s kereshetnk egy ft, ahol S a gykrcsompont. Ez a lentrl felfel
elemzs (bottom-up parsing).4 A fentrl lefel trtn elemzs pontosan definilhat a kvetkez
keressi problmaknt:
A kezdeti llapot (initial state) egy elemzsi fa, amelynek S a gykrcsompontja, s egy
ismeretlen gyerekcsompontja van: [S: ?]. ltalnossgban a keressi trben minden llapot egy
levezetsi fa.
Az llapottmenet-fggvny (successor function) kivlasztja azt a legszls csompontot bal
oldalon a fban, amelynek ismeretlen gyereke van. Ezek utn a nyelvtanban olyan szablyokat keres,
amelyek ezt a csompontot tartalmazzk gykrelemknt. Minden ilyen szablyra generl egy
kvetkez llapotot, ahol a ? szimblumot felcserli a szably jobb oldalnak megfelel listval.
szrevehet, hogy a fentrl lefel s a lentrl felfel trtn elemzs hasonl az elre-, illetve htrafel kvetkeztetshez, amiket a 7.
fejezetben rtunk le. Hamarosan ltni fogjuk, hogy ez az analgia pontos.
4
704
Created by XMLmind XSL-FO Converter.
Kommunikci
Pldul az 0 nyelvtanban kt szably van S-re, gy az [S: ?] ft a kvetkez kt szrmaztatottal
cserli le:
[S: [S: ?] [Conjunction: ?] [S: ?]]
[S: [NP: ?] [VP: ?]]
22.5. bra - A the wumpus is dead lentrl felfel trtn elemzsi lpsei. A szavakat
tartalmaz csompontok listjval kezdnk. Ezek utn egy szably jobb oldalra
illeszked rszsorozatokat felcserlnk egy j csomponttal, amelynek gykere a
szably bal oldala. Pldul a harmadik sorban az Article s Noun csompontokat
lecserljk egy NP csompontra, amelynek e kt csompont lesz a gyereke. A fentrl
lefel elemzs hasonl lpseket eredmnyezne, de pp a fordtott irnyban.
A lentrl felfel s a fentrl lefel trtn elemzs is lehet kevss hatkony azon mdok szmossga miatt,
ahogy klnbz kifejezsekhez tbbfle elemzs rendelhet. Mindkett elpazarolhatja az idt a keressi tr
irrelevns rszeinek vizsglatval. A fentrl lefel keress generlhat olyan kzbls csompontokat, amelyek
sosem zrhatk le szavakkal, s a lentrl felfel keress generlhat olyan rszleges elemzseket a szavakhoz,
amelyek nem fordulhatnak el egy S-ben sem.
705
Created by XMLmind XSL-FO Converter.
Kommunikci
Mg ha lenne is egy tkletes heurisztiknk, amely lehetv tenn az irrelevns kitrk nlkli keresst, ezek az
algoritmusok akkor sem lennnek hatkonyak, mivel bizonyos mondatoknak exponencilisan sok levezetsi fja
van. A kvetkez alfejezet megmutatja, hogy mit kezdhetnk ezzel a problmval.
Fontos
Ebben a rszben egy olyan algoritmust alaktunk ki, amely ezt a hatkonysgi problmt kezelni tudja.
Az alaptlet a dinamikus programozs (dynamic programming) egy pldja: minden alkalommal,
amikor egy rszfzrt elemznk, trold az eredmnyt, gy ksbb majd nem kell jraelemeznnk.
Pldul ha egyszer rjttnk, hogy a the students in section 2 of Computer Science 101 egy NP, ezt
eltrolhatjuk egy diagramnak (chart) nevezett adatstruktrban. Az gy mkd algoritmusokat
diagramelemzknek (chart parsers) nevezik. Mivel krnyezetfggetlen nyelvtanokkal foglalkozunk,
a keressi tr egy gnak kontextusban tallt tetszleges kifejezs ppgy szerepelhet a keressi tr
brmilyen ms gban is.
Egy n szbl ll mondat diagramja n + 1 csompontbl (vertex) s szmos, ezeket sszekt lbl (edges) ll.
A 22.6. brn lthatunk egy diagramot hat csomponttal (krk) s hrom llel (vonalak). Pldul a
[0, 5, S NP VP ]
cmkj l azt jelenti, hogy egy NP-t egy VP kvet, s egytt alkotnak egy S-et, mely a 0-tl 5-ig terjed
karaktersorozatot fedi le. Egy lben tallhat jel elvlasztja a mr megtalltat a mg keresettl.5 A jellel
zrd leket teljes leknek (complete edges) nevezik. A
[0, 2, S NP VP]
l szerint egy NP lefedi a 0-tl 2-ig terjed karaktersorozatot (az els kt sz), s ha tudunk tallni egy ezt
kvet VP-t, akkor lenne egy S-nk. Az ilyen lek, ahol a pont a vgk eltt van, gynevezett befejezetlen (nem
teljes) lek, s azt mondjuk, hogy az l egy VP-t vr.
22.6. bra - A The agent feels a breeze mondat diagramjnak egy rszlete. Mind a hat
csompont lthat, de csak hrom l szerepel azok kzl, melyek teljes elemzst
eredmnyeznnek.
706
Created by XMLmind XSL-FO Converter.
Kommunikci
A 22.7. bra a diagramelemz algoritmust szemllteti. A lnyege a fentrl lefel s a lentrl felfel legjobb
tulajdonsgainak tvzse. A JSL eljrs fentrl lefel mkdik: olyan bejegyzseket helyez el a diagramban,
amelyek megmondjk, hogy milyen szimblumok milyen helysznen elvrtak. A SZKENNER egy lentrl felfel
eljrs, amely a szavakbl indul ki, de egy szt csak egy meglev diagrambejegyzs kiegsztsre hasznl fel.
Hasonlkppen a KITERJESZT a komponenseket lentrl felfel pti, de csak egy meglev diagrambejegyzst
egszt ki.
Egy trkkt alkalmaztunk a teljes algoritmus elindtshoz: hozzadtunk egy [0, 0, S' S] let a diagramhoz,
ahol S a nyelvtan kezdeti szimbluma, S' pedig egy ltalunk most kitallt j szimblum. Az L-HOZZAD
meghvsa azt eredmnyezi, hogy a JSL leket ad az olyan szablyokhoz, melyek S-t eredmnyezhetnek, azaz
[S NP VP]. Ezek utn megvizsgljuk ezen szably els alkotelemt, NP-t, s mindenfle mdon olyan
szablyokat adunk hozz, melyek NP-t eredmnyeznek. Vgs soron a JSL fentrl lefel mdon minden
lehetsges lt hozzad, ami felhasznlhat a vgs S megalkotsban.
707
Created by XMLmind XSL-FO Converter.
Kommunikci
Amikor S' jslja kszen van, belpnk egy ciklusba, amely meghvja a SZKENNER-t a mondat minden egyes
szavra. Ha a j pozciban ll sz egy B kategria tagja, amit valamelyik l keres a j pozciban, akkor
kiterjesztjk azt az let megjellve a szt, mint B egy pldnyt. Vegyk szre, hogy a SZKENNER minden egyes
meghvsa vgzdhet a JSL s a KITERJESZT rekurzv meghvsval, ily mdon tvzve a fentrl lefel s a
lentrl felfel feldolgozst.
A msik lentrl felfel komponens, a KITERJESZT6 vesz egy teljes lt, amelynek bal oldaln B van, s
felhasznlja a diagramban lev brmely nem teljes szably kiterjesztsre, amely ott vgzdik, ahol a teljes l
kezddik, ha a nem teljes szably egy B-re vr.
A 22.8. s 22.9. brk mutatjk az I feel it mondat (amely a Do you feel a breeze? krdsre adott vlasz)
diagramjt s elemzsi lpseit. Tizenhrom l (am jelekkel elltva) szerepel a diagramon, melyek kzl t
teljes (a diagram verticei csompontjai felett) s nyolc befejezetlen (alattuk). Vegyk szre a JSL, SZKENNER
s KITERJESZT akcik ciklust. Pldul a Jsl felhasznlja azt a tnyt, hogy az a l egy S-t vr ahhoz, hogy
megellegezze egy NP (b l) s egy Pronoun (c l) jslatt. Ezek utn a SZKENNER felismeri, hogy van egy
Pronoun a megfelel helyen (d l), s a KITERJESZT kombinlja a b nem teljes lt a d teljes llel, gy
ellltva egy j lt, e-t.
22.8. bra - Az 0 I 1 feel 2 it 3 mondat diagramelemzse. Az m:S jells azt jelenti, hogy
az m lnek egy S ll a jobb oldaln, mg az f:VP/Verb azt, hogy az f lnek VP van a bal
A KITERJESZT eljrsunkat tradicionlisan TELJESS-TEV-nek hvtk. Ez a nv flrevezet, mivel az eljrs nem fejez be
leket: bemenetknt vesz egy teljes lt, s kiterjeszt nem teljes leket.
6
708
Created by XMLmind XSL-FO Converter.
Kommunikci
oldaln, de egy Verb-et vr. t teljes l van a csompontok felett, s nyolc hinyos
alattuk.
A diagramelemz algoritmus elkerli az lek nagy halmaznak ptst, amit az egyszer lentrl felfel eljrs
vgigvizsglt volna. Vegyk a The ride the horse gave was wild mondatot. Egy lentrl felfel elemzs
megjelln a ride the horse-t mint egy VP-t, majd elvetn az elemzsi ft, amint rjnne, hogy nem illeszkedik
egy nagyobb S-be. Azonban az 0 nem engedi meg, hogy egy VP a the-t kvesse, gy a diagramelemz
algoritmus sosem jsol VP-t ezen a ponton, gy elkerli ott a VP szerkezet idpocskol ptst. Azokat az
algoritmusokat, melyek balrl jobbra mkdnek, s elkerlik ezen lehetetlen szerkezetek felptst, balsarokelemzknek (left-corner parsers) nevezzk, mivel egy olyan elemzsi ft ptenek fel, amely a nyelvtan kezd
szimblumval indul, s a mondat legszln balra (a bal sarokban) ll sz fel terjeszkednek. Egy lt csak
akkor adnak a diagramhoz, ha ezen elemzsi fa kiterjesztst szolglhatja (pldaknt lsd 22.10. bra).
709
Created by XMLmind XSL-FO Converter.
Kommunikci
A diagramelemz csak polinomilis id- s trigny. O(kn2) helyet ignyel az lek trolsra, ahol n a
mondatban lev szavak szma s k egy, a nyelvtantl fgg konstans. Amikor mr nem tud tbb lt pteni,
megll, gy tudjuk, hogy az algoritmus befejezdtt (mg akkor is, ha vannak bal-rekurzv szablyok).
Valjban O(n3) idt ignyel legrosszabb esetben, ami a legjobb, amit elrhetnk krnyezetfggetlen
nyelvtanokra. A DIAGRAMELEMZ szk keresztmetszete a KITERJESZT, amelynek meg kell prblnia
kiterjeszteni a j-ben vgzd O(n) nem teljes l mindegyikt az ugyanott kezdd O(n) teljes l mindegyikvel,
j lehetsges n + 1 klnbz rtkre. Ezeket sszeszorozva kapjuk O(n3)-at. Ez egyfajta paradoxont ad a
szmunkra: hogyan tud egy O(n3) algoritmus visszaadni egy vlaszt, amely exponencilis szmossg elemzsi
ft tartalmazhat? Vegynk egy pldt: a
710
Created by XMLmind XSL-FO Converter.
Kommunikci
A lnyeg az, hogy minden csompont lehet egy hagyomnyos elemzsi fa csompont, illetve csompontok egy
halmaza is. Ez lehetv teszi szmunkra, hogy exponencilis szm elemzst reprezentljunk polinomilis
idben s trhelyen. Termszetesen n = 2 esetn nincs sok klnbsg 2n s 2n kztt, de nagy n-ekre egy ilyen
reprezentci jelents megtakartst eredmnyez. Sajnlatos mdon ez az egyszer tmrtett erd megkzelts
nem kezeli az sszes O(n!) lehetsget a kapcsoldsok sszerendelsre. Maxwell s Kaplan (1995)
megmutatja, hogy egy, az igazsg-karbantart rendszerek alapelveire pl, sszetettebb reprezentci ezeket a
fkat mg jobban sszetmrtheti.
4. Kiterjesztett nyelvtanok
A 22.2. alfejezetben lttuk, hogy az 0 egyszer nyelvtana ellltja az angol nyelv I smell a stench s sok
ms mondatt. Sajnos azonban sok nem megengedett mondatot is elllt, mint pldul a Me smell a stench.
Ezen problma elkerlse rdekben a nyelvtanunknak tudnia kellene, hogy a me nem rvnyes NP akkor,
amikor a mondat alanya. A nyelvszek azt mondjk, hogy az I nvms alanyeset, mg a me trgyeset. 9 Ha
figyelembe vesszk az eseteket, akkor rjvnk, hogy az 0 nem krnyezetfggetlen: nem igaz az, hogy minden
NP minden mssal egyenrtk, fggetlenl a krnyezettl. A problma megoldsra bevezethetnk olyan j
kategrikat, mint az NPS s NPO a trgyas s alanyi fnvi kifejezsekre. Ezenkvl kett kellene bontanunk a
Pronoun kategrit a PronounS-re (amelyik tartalmazza az I-t) s PronounO-ra (amelyik tartalmazza a me-t).
A 22.11. bra fels rsze megmutatja az esetegyeztets teljes BNF nyelvtant; az gy kapott nyelvet 1-nek
Az [S: Fall [VP: leaves fall]] elemzs megegyezik az Autumn abandons autumn mondattal.
Emellett a komponensek sszekapcsoldsnak O(n!) szm rtelmezse lenne pldul (X s (Y s Z)), illetve ((X s Y) s Z). De ez mr
egy msik trtnet, amelyet Church s Patil (1982) igen jl mesl el.
9
Az angolban az alanyesetre a subjective case mellett alkalmanknt a nominative case kifejezst is hasznljk. Hasonlkppen a
trgyesetre az objective case mellett az accusative case is hasznlatos esetenknt. Sok nyelvnek van rszes esete is az indirekt trgy
pozciban ll szavakra.
7
8
711
Created by XMLmind XSL-FO Converter.
Kommunikci
nevezzk. Vegyk szre, hogy az sszes NP szablyt meg kell kettznnk, egyszer az NPS, msszor az NPO
esetre.
22.11. bra - Fell: Az 1 egy BNF nyelvtana, amely kezeli az alanyi s a trgyas esetet a
fnvi kifejezsekben, s ezrt annyira nem is generl tl. Az 1 nyelvtanval
megegyez rszeket elhagytuk. Lent: Az 1 egy definit klz nyelvtana (DCG).
Sajnos az 1 mg mindig tlgenerl. Az angol s sok ms nyelv megkveteli az alany s a mondat f igjnek
egyeztetst (agreement). Pldul ha I az alany, akkor az I smell nyelvtanilag helyes, mg az I smells
nem. Ha it az alany, akkor fordtva igaz. Az angolban az egyeztetsbl szrmaz klnbsgek minimlisak: a
legtbb ignek egy alakja van egyes szm harmadik szemly alanyokra (he, she vagy it), s egy msik alakja
az egyes s tbbes szm s a szemlyek minden ms kombincijra. Egy kivtel van: az I am / you are / he is
hrom formval rendelkezik. Ha kombinljuk ezt a hrom klnbsgttelt az NPS s NPO klnbsgttellel,
akkor NP hat alakjt kapjuk. Ahogy tovbbi klnbzsgeket fedeznk fel, vgl egy exponencilis sokasgot
kapunk.
Az alternatv megkzelts a nyelvtan ltez szablyainak kiterjesztse (augmenting) j szablyok bevezetse
helyett. Elszr megmutatjuk egy pldn keresztl, hogy hogyan szeretnnk, hogy a kiterjesztett szablyok
kinzzenek (a 22.11. bra als fele), azutn formlisan megadjuk, hogyan kell ilyen szablyokat rtelmezni. A
kiterjesztett szablyok nem zr kategrik esetben megengedik paramterek alkalmazst. A 22.11. bra
megmutatja, hogyan rhatjuk le az 1 nyelvtant kiterjesztett szablyokkal. Az NP s Pronoun kategrik
rendelkeznek egy olyan paramterrel, amely lerja az esetket. (A fnevek nem rendelkeznek esettel az
angolban, br sok ms nyelvben igen.) Az S-re vonatkoz szablyban az NP-nek alanyi esetnek kell lennie,
mg a VP s PP szablyokban trgyasnak. Az NP szably egy vltozt fogad paramterknt, az eset-et. A
szndk az, hogy az NP tetszleges eset lehet, de ha trjuk Pronoun-ra, akkor ugyanolyan esetnek kell
lennie. Egy vltoz ilyen hasznlata elkerlve a dntst, amikor a klnbsgttel nem fontos visszatartja a
szablyhalmaz mretnek a tulajdonsgok szmval arnyosan exponencilis nvekedst.
A kiterjeszts ezen formalizmust definit klz nyelvtannak (definite clause grammar) vagy DCG-nek hvjuk,
mivel minden nyelvtani szably rtelmezhet a Horn-logikban szerepl definit klzknt.10 Elsknt azt
mutatjuk meg, hogy egy normlis, kiterjeszts nlkli szably hogyan rtelmezhet definit klzknt. Minden
kategriajelet karaktersorozatra vonatkoz prediktumnak tekintnk, gy az NP(s) igaz, ha az s karaktersorozat
egy NP-t forml. Az
S NP VP
712
Created by XMLmind XSL-FO Converter.
Kommunikci
Fontos
Itt s1 + s2 kt karaktersorozat sszefzst jelenti, gy ez a szably azt mondja, hogy ha van egy s1 fzr,
ami egy NP s egy s2 fzr, ami egy VP, akkor az sszekapcsolsukkal keletkez fzr egy S, ami
pontosan megegyezik azzal, ahogy a CFG-szablyt korbban rtelmeztk. Fontos szrevennnk, hogy
a DCG-k lehetv teszik szmunkra, hogy az elemzsrl mint logikai kvetkeztetsrl beszljnk. Ez
lehetv teszi, hogy nyelvek s karaktersorozatok felett sok klnbz mdon kvetkeztessnk.
Pldul ez azt jelenti, hogy egy lentrl felfel elemzst elrefel kvetkeztetssel, egy fentrl lefel
elemzst pedig htrafel kvetkeztetssel vgezhetnk el. Azt is ltni fogjuk, hogy ez azt is jelenti,
hogy ugyanazt a nyelvtant elemzsre s generlsra is hasznlhatjuk.
A DCG-megkzelts igazi haszna az, hogy kiterjeszthetjk a kategriaszimblumokat a karakterfzreken kvl
tovbbi argumentumokkal. Pldul a
NP(eset) Pronoun(eset)
Eszerint ha az s1 fzr az eset vltoz ltal meghatrozott eset Pronoun, akkor s1 egy ugyanolyan eset NP is.
ltalnossgban egy kategriaszimblumot tetszleges szm argumentummal kiterjeszthetnk, s az
argumentumok egyben paramterek, amelyek a szoksos Horn-klz kvetkeztets egyestsnek trgyai.
Van ra is ennek a knyelemnek: a nyelvtan rjt elltjuk a ttelbizonytk teljes erejvel, gy feladjuk a
szintaktikai elemzk ltal garantlt O(n3)-at; a kiterjesztsekkel kiegsztett elemzs lehet NP-teljes, vagy akr
eldnthetetlen, a kiterjesztsektl fggen.
Nhny tovbbi trkk szksges ahhoz, hogy a DCG mkdjn; pldul szksgnk van egy mdszerre, hogy
zr szimblumokat adhassunk meg, s knyelmes egy olyan mdszert is alkalmaznunk, amely nem engedi az
automatikus karaktersorozat-argumentum hozzadst. Mindent sszerakva, a definit klz nyelvtant a
kvetkezkppen definilhatjuk:
Az X Y Z jells fordtsa Y(s1) Z(s2) X(s1 + s2 + )
Az X Y | Z | jells fordtsa Y(s) Z(s) X(s)
Mindkt megelz szablyban brmelyik Y nem zr szimblum egy vagy tbb argumentummal
kiterjeszthet. Brmely argumentum lehet vltoz, konstans vagy argumentumok fggvnye. A fordtsban
ezen argumentumok megelzik a karakterfzr argumentumot (pldul az NP(eset) fordtsa NP(eset, s1)).
A {P()} jells szerepelhet egy szably jobb oldaln, s vltozs nlkl talakul P()-v. Ez lehetv teszi
a nyelvtan rja szmra, hogy egy P()-re vonatkoz tesztet anlkl elhelyezzen, hogy ahhoz
automatikusan hozzaddjon a karakterfzr-argumentum.
Az X word jells fordtsa X([word]).
Az alanyige egyeztetse szintn kezelhet kiterjesztssel, de ezt a 22.2. feladatra halasztjuk. Helyette egy
nehezebb problmval foglalkozunk: az igk alkategrikba osztsval.
Kommunikci
kifejezsen bell kveti az igt. Azaz a give the gold to me-ben az NP a the gold s a to me PP a give
kiegsztje.11 Ezt lerhatjuk gy:
Verb([NP, PP]) give | hand |
Lehetsges, hogy egy ighez tbb, klnbz alkategrira bonts ltezik, csakgy, mint ahogy egy sz szmra
is lehetsges, hogy tbb, klnbz kategriba tartozzon. Valjban a give rendelkezik az [NP, NP]
alkategria-listval is, mint a Give me the gold mondatban. Ezt ugyangy kezelhetjk, mint minden ms
tbbrtelmsget. A 22.12. bra ad pr pldt igkre s alkategria-listikra (angolul rviden subcat).
Hrom dolgot tesznk az igei alkategrik nyelvtanba illesztshez. Az els lps a VP kategria kiterjesztse
egy alkategria-argumentummal, VP(subcat), amely felsorolja azokat a komponenseket, amikkel teljes VP
formlhat. Pldul a give teljes VP-v tehet [NP, PP] hozzadsval, give the gold teljess tehet [PP]
hozzadsval, s a give the gold to me mr teljes; alkategria-listja res, []. Ez a kvetkez szablyokat adja
VP-re:
VP(subcat)
Verb(subcat)
VP(subcat
NP(Objective)
VP(subcat
Adjective
[Adjective])
VP(subcat + [PP]) PP
[NP])
Az utols sor gy olvashat: Adott subcat alkategria-listval rendelkez VP formlhat egy begyazott VPbl, amit egy PP kvet, akkor, ha a begyazott VP rendelkezik egy olyan alkategria-listval, ami a subcat lista
elemeivel kezddik s PP-vel folytatdik. Pldul egy VP([])-t egy VP([PP]) s az azt kvet PP alkot. Az
els sor szerint egy VP, amely subcat alkategria-listval rendelkezik, formlhat egy ugyanolyan alkategrialistval rendelkez Verb segtsgvel. Pldul a VP([NP]) ltrehozhat egy Verb([NP]) ltal. Egy plda ilyen
igre a grab, teht a grab the gold egy VP([]).
Ez a kiegszt (complement) egyik defincija, de vannak ms terminolgit hasznl szerzk is. Egyesek szerint az ige alanya is egy
kiegszt. Msok szerint csak az elljri kifejezs kiegszt, s a fnvi kifejezst egy rvelsnek (argument) kell hvni.
11
714
Created by XMLmind XSL-FO Converter.
Kommunikci
A msodik lps az S-re vonatkoz szably megvltoztatsa gy, hogy szksgess tegyen egy igei kifejezst,
melynek sszes kiegsztse megvan, s gy [] alkategria-listja van. Ez azt jelenti, hogy az I grab the gold
rvnyes mondat, de a You give nem az. Az j szably,
S NP(Subjective) VP([])
a kvetkezkppen olvashat: Egy mondatot sszellthatunk egy alanyi esetben ll NP-bl s az azt kvet,
res alkategria-listj VP-bl. A 22.13. bra bemutat egy elemzsi ft, amelyik ezt a nyelvtant hasznlja.
22.13. bra - A You give me the gold (Ideadod nekem az aranyat) elemzsi fja, amely
bemutatja az ige s az igei kifejezs alkategriit
A harmadik lpsben gondolunk arra, hogy a kiegsztsek mellett az igei (s egyb) kifejezsek segdszavakat
(adjuncts) is kaphatnak, melyek nem egy ighez ktd kifejezsek, hanem mindenfle igei kifejezsben
feltnhetnek. Az idt s helyet jelkpez kifejezsek segdszavak, mivel szinte minden cselekvs vagy esemny
rendelkezhet idponttal s helysznnel. Pldul a now hatrozsz az I smell a wumpus now mondatban s
az on Tuesday PP a give me the gold on Tuesday-ban segdszavak. me, kt szably a segdszavak
megengedshez:
VP(subcat)
|
VP(subcat) PP
VP(subcat) Adverb
Kommunikci
nyelvtanok generlkpessge a kombincik szmtl fgg. Ha vges szm van, akkor a kiterjesztett nyelvtan
ekvivalens egy krnyezetfggetlen nyelvtannal: a szablysma felcserlhet egyedi krnyezetfggetlen
szablyokkal. Azonban ha vgtelen szm van, akkor a kiterjesztett nyelvtanok nem krnyezetfggetlen
nyelveket is lerhatnak. Pldul az anbncn krnyezetfgg nyelv lerhat a kvetkez kiterjesztett nyelvtannal:
S(n) A(n) B(n) C(n)
A(1) a A(n + 1) a
A(n)
B(1) b B(n + 1) b
B(n)
C(1) c C(n + 1) c
C(n)
5. Szemantikai rtelmezs
Eddig csak a nyelv szintaktikai analzist vizsgltuk. Ebben a fejezetben rtrnk a szemantikra (semantics)
a megnyilatkozs (utterance) jelentsnek kinyersre. Ebben a fejezetben az elsrend logikt hasznljuk
reprezentcis nyelvknt, gy a szemantikai rtelmezs egy FOL kifejezs s egy nyelvi kifejezs
sszerendelsnek a folyamata. Intuitv mdon kzeltve, a the wumpus kifejezs jelentse az a nagy, szrs
szrnyeteg, amit a logikban a Wumpus1 logikai kifejezssel jelznk, s a the wumpus is dead jelentse a
Dead(Wumpus1) logikai llts. Ez a fejezet ezt az intucit pontostja. Egy egyszer pldval kezdnk: a
ngyzethl helyszneit ler szabllyal:
NP Digit Digit
Kiterjesztjk a szablyt gy, hogy minden sszetevhz egy argumentumot illesztnk, amely az sszetev
szemantikjt reprezentlja. A kvetkezt kapjuk:
NP([x, y]) Digit(x) Digit(y)
E szerint egy karaktersorozat, amely egy x szemantikj szmjegybl s egy azt kvet y szemantikj
szmjegybl ll, egy [x, y] szemantikval rendelkez NP-t forml, amely a hl egy ngyzetre alkalmazott
jellsnk.
Vegyk szre, hogy a teljes NP szemantikja nagymrtkben az sszetevinek szemantikjn alapszik. Mr
lttuk a kompozcis szemantika (compositional semantics) ezen tlett korbban: a logikban a P Q
jelentst P, Q s hatrozzk meg; az aritmetikban az x + y jelentst x, y s a + hatrozzk meg. A 22.14.
bra megmutatja, hogy a DCG jellsrendszer hogyan hasznlhat egy aritmetikai kifejezseket ler nyelvtan
szemantikval trtn kiterjesztsre, s a 22.15. bra mutatja a 3 + (4 2) ezen nyelvtan alapjn kapott
elemzsi fjt. Az elemzsi fa gykere Exp(5), egy kifejezs, melynek szemantikai rtelmezse 5.
716
Created by XMLmind XSL-FO Converter.
Kommunikci
Ezutn szksgnk van egy szablyra, amely szerint egy obj szemantikj NP, melyet egy rel szemantikj VP
kvet, egytt egy olyan mondatot eredmnyez, amelynek szemantikja a rel alkalmazsa az obj-ra:
S(rel(obj)) NP(obj) VP(rel)
22.16. bra - Egy nyelvtan, amely kpes egy elemzsi fa s szemantikai rtelmezs
levezetsre a John loves Mary (s hrom msik) mondat szmra
717
Created by XMLmind XSL-FO Converter.
Kommunikci
22.17. bra - A John loves Mary fzr elemzsi fja szemantikai rtelmezsekkel
A szemantika htralev rsze az eddigi vlasztsainkbl egyenesen kvetkezik. Mivel a VP-ket prediktumknt
reprezentljuk, j tlet konzisztens mdon az igket is prediktumknt brzolni. A loves ige reprezentcija
y x Loves(x, y) prediktum, ami pldul egy Mary argumentum esetn x Loves(x, Mary) prediktummal tr
vissza.
A VP Verb NP szably alkalmazza az ige szemantikai rtelmezsbl kapott prediktumot az NP
(szemantikai) rtelmezsbl kapott objektumra a teljes VP szemantikai rtelmezsnek kinyersre. Vgl a
22.16. brn lthat nyelvtant s a 22.17. brn tallhat elemzsi ft kapjuk.
5.2. Id s igeid
Most tegyk fel, hogy a John loves Mary s a John loved Mary kztti klnbsget szeretnnk
reprezentlni. Az angol igeidket (past [mlt], present [jelen] s future [jv]) hasznl egy esemny relatv
idejnek jelzsre. Egy j vlaszts az esemnyek idejnek reprezentlsra a 10.3. alfejezet esemnykalkulus
jellsrendszere. Az esemnykalkulussal a kt mondatunk a kvetkezkppen rtelmezhet:
e Loves(John, Mary) During(Now, e)
e Loves(John, Mary) After(Now, e)
718
Created by XMLmind XSL-FO Converter.
Kommunikci
E vltozstl eltekintve a nyelvtannal kapcsolatban minden ms vltozatlan marad, ami sztnz hr; azt
sugallja, hogy helyes ton jrunk, ha ilyen knnyedn bonyolthatjuk pldul az igeidvel (br csak rintettk az
idre s igeidre vonatkoz teljes nyelvtan felsznt). E bemelegtsknt elrt sikerrel kszen llunk egy sokkal
nehezebb reprezentcis problma kezelsre.
5.3. Kvantifikls
Nzzk a kvetkez pldt: Every agent smells a wumpus. A mondat valjban tbbrtelm: a javasolt
rtelmezs szerint az gensek klnbz wumpusokat szlelhetnek, de egy alternatv jelents szerint csak egy
wumpus van, akit mindenki rez.12 A kt interpretcit a kvetkez mdon brzolhatjuk:
a a Agents w w Wumpuses e e Smell(a, w) During(Now, e)
w
A tbbrtelmsg problmjt elhalasztjuk ksbbre, most csak az els rtelmezst vizsgljuk. Megprbljuk az
sszetevi szerint elemezni, NP s VP komponensekre bontva:
Every agent NP(a a Agents P)
smells a wumpus VP(w w Wumpuses e (e Smell(a, w) During(Now, e))
Mris kt nehzsg tmadt. Elszr is, a teljes mondat szemantikja, gy tnik, megegyezik az NP
szemantikjval, melyben a VP tlti ki a P rsz szemantikjt. Ez azt jelenti, hogy a mondat szemantikjt nem
formlhatjuk rel(obj) segtsgvel. Megtehetjk obj(rel) ltal, ami (legalbbis els rnzsre) kicsit klnsnek
tnik. A msodik problma az, hogy az a vltozt a Smell relci argumentumaknt kell megkapnunk. Ms
szavakkal, a mondat szemantikja a VP szemantikjnak megfelel NP argumentumrekeszbe val illesztsvel
addik, mikzben az NP-ben tallhat a vltozt is betesszk a VP szemantika megfelel
argumentumrekeszbe. gy tnik, mintha kt funkcionlis kompozcink lenne, s ez azt sugallja, hogy
meglehetsen knny lesz sszezavarodni. A bonyolultsg abbl a tnybl ered, hogy a szemantikai struktra
nagyon klnbz a szintaktikaitl.
Hogy elkerljk ezt a zrzavart, sok modern nyelvtan ms mdszert vlaszt. Definilnak egy kzbls formt
(intermediate form) a szintaxis s a szemantika kztti kzvettsre. A kzbls formnak kt
kulcstulajdonsga van. Egyrszt strukturlisan hasonl a mondat szintaxishoz, gy knnyen elllthat
kompozcis eszkzkkel. Msrszt elg informcit tartalmaz, s gy lefordthat egy regulris elsrend
logikai mondatt. Mivel a szintaktikai s a logikai alak kztt helyezkedik el, nha kvzilogikai formnak
(quasi-logical form)13 nevezik. A fejezetben egy kvzilogikai formt hasznlunk, mely a teljes elsrend logikt
tartalmazza, lambdakifejezssekkel s egy j konstrukcival kiegsztve, amit kvantifiklt termnek
(quantified term) neveznk. Az every agent szemantikai rtelmezst jelent kvantifiklt term a
kvetkezkppen rhat:
[a
a Agents]
Ez olyan, mint egy logikai mondat, de ugyanolyan mdon hasznljuk, mint a logikai termeket. Az Every agent
smells a wumpus kvzilogikai rtelmezse:
e (e Smell([a a Agents], [w w Wumpuses]) During(Now, e))
A kvzilogikai alak generlshoz szablyaink kzl sok vltozatlan marad. Az S-re vonatkoz szably S
szemantikjt mg mindig rel(obj) segtsgvel adja meg. Bizonyos szablyok vltoznak; az a szra
vonatkoz lexikai szably a kvetkez:
Article() a
Ha ez az rtelmezs valszntlennek tnik, akkor vizsglja meg az Every Protestant believes in a just God mondatot.
Egyes kvzilogikai formkra jellemz az is, hogy olyan tbbrtelmsgek tmr kifejezsre is alkalmasak, amelyeket logikai formban
csak hossz diszjunkcik segtsgvel lehetne kifejezni.
12
13
719
Created by XMLmind XSL-FO Converter.
Kommunikci
E szerint az NP szemantikja egy kvantifiklt term ahol a kvantifiklst a nvel hatrozza meg egy j x
vltozval s egy propozcival, amely a fnv szemantikjt az x vltozra alkalmazza. Az NP-re vonatkoz
tovbbi szablyok hasonlk. A 22.18. bra mutatja be a szemantikai tpusokat, s pldt ad minden egyes
szintaktikai kategrira a kvzilogikai brzols szerint. A 22.19. bra az Every agent smells a wumpus e
megkzelts szerinti elemzst mutatja, a 22.20. pedig a teljes nyelvtant.
Ezek utn t kell alaktanunk a kvzilogikai formt valdi elsrend logikaiv a kvantifiklt termek igazi termm alaktsval. Ezt egy egyszer szabllyal tesszk meg: minden egyes QLF kvzilogika formn belli [q x
P(x)] kvantifiklt termet a cserljk ki x-re, s cserljk a QLF-et q x P(x) op QLF formra, ahol az op opertor
akkor, ha a q , s , amennyiben a q vagy !. Pldul az Every dog has a day (Minden kutynak van
egy napja) mondat a kvetkez kvzilogikai formval rendelkezik:
e (e Has([d d Dogs], [a a Days], Now))
Nem specifikltuk, hogy a kt kvantifiklt term melyikt kell elsknt elvenni, gy valjban kt lehetsges
rtelmezs van:
d
a a Days d d Dogs e
e Has(d, a, Now)
22.19. bra - Az Every agent smells a wumpus mondat elemzsi fja, amely mind a
szintaktikai struktrt, mind a szemantikai rtelmezseket mutatja
720
Created by XMLmind XSL-FO Converter.
Kommunikci
Az els szerint minden kutynak megvan a maga napja, mg a msodik szerint van egy klnleges nap, ami
minden kutyra ugyanaz. A kett kztti vlaszts a tbbrtelmsg feloldsnak feladata. A kvantifiklt termek
balrl jobbra sorrendje gyakran illeszkedik a kvantifiklk balrl jobbra sorrendjre, de ms tnyezk is
szmtanak. A kvzilogikai alak elnye az, hogy tmren reprezentlja az sszes lehetsget. A htrnya pedig
az, hogy nem segti a vlasztst kzttk; amihez szksgnk van a tbbrtelmsg feloldsnak teljes erejre
az sszes tnyt felhasznlva.
721
Created by XMLmind XSL-FO Converter.
Kommunikci
rtelmezs hogyan tehet teljess az egyes jelltek rtelmezshez az adott szitucit ler kontextusfgg
informcik hozzadsval.
A gyakorlati informcira legnyilvnvalbban a referencilis indexek (indexicals) feloldshoz van szksg,
amelyek kzvetlenl az adott szitucira utal kifejezsek. Pldul az I am in Boston today (Ma Bostonban
vagyok) mondatban az I s today referencilis indexek rtelmezse attl fgg, hogy ki s mikor ejtette ki a
mondatot. A referencilis indexeket konstansokkal (mint pldul a Speaker) reprezentljuk, amelyek
valjban vltoz dolgok (fluents) azaz a szitucitl fggnek. A hallgatnak, aki szleli a szlsaktust, azt is
szlelnie kell, hogy ki a beszl, s felhasznlja ezt az informcit a referencilis indexek feloldsra. Pldul a
hallgat tudhatja, hogy T((Speaker = AgentB), Now).
Egy felszlts, mint pldul a go to 2, 2 implicit mdon a hallgatra vonatkozik. Eddig az S nyelvtanunk csak
deklaratv mondatokat rt le. Knnyen kiterjeszthetjk felszltsok kezelsre.14
A felszltst olyan VP segtsgvel formlhatjuk, ahol az alany implicit mdon a hallgat. Meg kell
klnbztetnnk a felszltsokat az lltsoktl, ezrt megvltoztatjuk az S-re vonatkoz szablyokat a
szlsaktus tpusnak beillesztsvel a kvzilogikai formba:
S(Statementl(Speaker, rel(obj))) NP(obj) VP(rel)
S(Command(Speaker, rel(Hearer))) VP(rel)
gy a go to 2, 2 kvzilogikai alakja:15
Command(e e Go(Hearer, [2, 2]))
Egy teljes kommunikl gens megvalstshoz szksgnk lenne a krdsek nyelvtanra is. A krdsek kezelse kvl esik e knyv
terletn, mivel sszetevk kztti hossz tv fggsgeket (long-distance dependecies) vonzanak magukkal. Pldul a Whom did the
agent tell you to give the gold to? mondatban a zr to elemzsnek hinyz NP-j PP-nek kell lennie; a hinyz NP-t a mondat els
szava, a who helyettesti. Kiterjesztsek egy komplex rendszere biztostja, hogy a hinyz NP-k sszeillesztdjenek a helyettest
szavakkal.
15
Vegyk szre, hogy egy felszlts kvzilogikai formja nem foglalja magban az esemny idejt (azaz a During(Now, e)-t)! Ez azrt van,
mert a go valjban a sz igeid nlkli vltozata, nem a jelen idej. Nem lehet megllaptani a klnbsget a go esetben, de figyelje
meg a Be good! felszlts helyes alakjt (a be igeid nlkli alakjt hasznlva), amely nem Are good!. Annak biztostsra, hogy a
helyes igeidt hasznljuk, kiegszthetnnk a VP-ket egy igeid kiterjesztssel, s a felszltsok szablynak jobb oldalra ezt rhatnnk:
VP(rel, untensed).
14
722
Created by XMLmind XSL-FO Converter.
Kommunikci
szisztematikus nyelvtan egy olyan megkzelts, amely knnyv teszi, hogy a szemantikai alak legfontosabb
rszeire nagyobb hangslyt helyezznk.
6. Tbbrtelmsg s feloldsa
Bizonyos esetekben a hallgatk tudatban vannak egy megnyilatkozs tbbrtelmsgnek. me, nhny plda a
napilapok szalagcmeibl:
Squad helps dog bite victim.
Helicopter powered by human flies.
Once-sagging cloth diaper industry saved by full dumps.
Portable toilet bombed; police have nothing to go on.
British left waffles on Falkland Islands.
Teacher strikes idle kids.
Milk drinkers are turning to powder.
Drunk gets nine months in violin case.
(A mondatok fordtst s rtelmezst az olvasra hagyjuk a ford.)
Fontos
Azonban legtbb esetben a beszd, amit hallunk, egyrtelmnek tnik. Ezrt amikor a kutatk elszr
kezdtek a nyelv elemzsre szmtgpeket hasznlni a hatvanas vekben, igen meglepdve
tapasztaltk, hogy majdnem minden megnyilatkozs ersen tbbrtelm, br az alternatv rtelmezsek
egy anyanyelvi beszl szmra lehet, hogy nem nyilvnvalk. Egy nagy nyelvtannal s szkinccsel
rendelkez rendszer rtelmezsek ezreit tallhatja egy teljesen tlagos mondatra. Vegyk pldul a
The batter hit the ball mondatot, amelynek ltszlag egy egyrtelm rtelmezse van, miszerint a
baseballjtkos megt egy baseball-labdt. De klnbz rtelmezst kapunk, ha az ezt megelz
mondat ez: The mad scientist unleashed a tidal wave of cake mix towards the ballroom. Ez a plda a
lexiklis tbbrtelmsgen (lexical ambiguity) alapszik, amikor egy sznak egynl tbb jelentse
van. A lexiklis tbbrtelmsg igen gyakori: a back lehet hatrozsz (go back), mellknv (back
door), fnv (the back of the room) s ige (back up your files). A Jack lehet nv, fnv (krtya,
hatszg fm jtkdarab, hajzsi zszl, hal, hm szamr, dugasz vagy nehz objektumok emelsre
szolgl eszkz), illetve lehet ige (felemelni egy autt, fnnyel vadszni vagy ersen megtni a
baseball-labdt).
A szintaktikai tbbrtelmsg (syntactic ambiguity) (avagy strukturlis tbbrtelmsg (structural
ambiguity)) a lexiklis tbbrtelmsggel egytt vagy nlkle is elfordulhat. Pldul az I smelled a wumpus
in 2,2 fzrnek kt rtelmezse lehet: az egyikben az in 2,2 prepozcis kifejezs a fnevet mdostja, a
msikban az igt. A szintaktikai tbbrtelmsg szemantikai tbbrtelmsghez (semantic ambiguity) vezet,
mivel az egyik rtelmezs szerint a wumpus a 2,2-n van, a msik szerint a szaga van a 2,2-n. Ebben az esetben a
rossz rtelmezs hallos tveds lehet.
A szemantikai tbbrtelmsg mg olyan kifejezsekben is feltnhet, ahol nincs lexiklis vagy szintaktikai
tbbrtelmsg. Pldul a cat person fnvi kifejezs takarhat olyasvalakit, aki szereti a macskaflket, vagy
az Attack of the Cat People (A macskaemberek tmadsa) c. film szalagcmt is. Egy coast road lehet olyan
t, ami a partvonalat kveti, s olyan, amelyik a partra vezet.
Vgezetl lehet tbbrtelmsg a sz szerinti s az tvitt rtelm jelentsek kztt. A jelkpes beszd fontos a
kltszetben, de meglepen gyakori a mindennapi beszdben is. A metonmia (metonymy) egy olyan jelkpes
beszd, amikor az egyik objektum helyre egy msikat lltunk. Amikor azt halljuk, hogy Chrysler announced
a new model, nem rtelmezzk akknt, hogy a cgek beszlni tudnak; inkbb azt rtjk ezalatt, hogy a cget
kpvisel szviv tette a bejelentst. A metonmia gyakori, s az emberi hallgatk gyakran szrevtlenl
interpretljk. Sajnlatos mdon a nyelvtanunk abban a formban, ahogy lertuk, nem ennyire rugalmas. Ahhoz,
723
Created by XMLmind XSL-FO Converter.
Kommunikci
hogy a metonmia szemantikjt megfelelen kezelni tudjuk, a tbbrtelmsg teljesen j szintjt kell
bevezetnnk. Ezt gy tesszk meg, hogy kt objektumot hasznlunk a mondat minden kifejezsnek
szemantikai rtelmezsnl: egyet arra az objektumra, amelyre a kifejezs sz szerint vonatkozik (Chrysler),
mg egy msikkal utalunk a fogalomcserre (szviv). Ezek utn meg kell mondanunk, hogy sszefggs van a
kett kztt. Jelenlegi nyelvtanunkban a Chrysler announced rtelmezse a kvetkez:
x, e x = Chrysler e Announce(x) After(Now, e)
E szerint van egy olyan x entits, amely azonos a Chryslerrel, s van egy msik m entits, amelyik a bejelentst
tette, s a kett metonmiai relciban ll egymssal. A kvetkez lps annak meghatrozsa, hogy milyen
metonmiarelcik fordulhatnak el. A legegyszerbb eset az, amikor nincs semmilyen metonmia az x sz
szerinti objektum s az m metonmiai objektum azonos:
m, x (m = x) Metonymy(m, x)
A Chrysler pldnl helynval ltalnosts az, hogy egy vllalat llhat a szvivje helyn:
m, x x Organizations Spokesperson(m, x) Metonymy(m, x)
Tovbbi fogalomcserk lehetnek a szerz a munkkra (I read Shakespeare), vagy ltalban a ltrehoz az
alkotsra (I drive a Honda) s a rsz az egszre (The Red Sox need a strong arm). A metonmia egyes pldi,
mint a The ham sandwich on Table 4 wants another beer jszerbbek, s az adott szitucinak megfelelen
rtelmezik ket.
Az itt vzolt szablyok lehetv teszik a szmunkra, hogy a Chrysler announced a new model mondat
magyarzatt elksztsk, de a magyarzat nem logikai kvetkeztets tjn jn ltre. Valsznsgi vagy
nemmonoton kvetkeztetst kell hasznlnunk ahhoz, hogy magyarzatjelltekkel lljunk el.
Egy metafora (metaphor) olyan jelkpes beszd, amikor egy adott sz szerinti jelentssel br kifejezst
hasznlunk egy msik jelents sugalmazsra analgia segtsgvel. A legtbb ember gy gondol a metaforra,
mint a kltk eszkzre, mely nem jtszik nagy szerepet a mindennapi szvegekben. Mindazonltal nagyon sok
alapvet metafort olyan gyakran hasznlunk, hogy mg azt sem vesszk szre, hogy azok metafork. Egy ilyen
metafora annak a gondolata, hogy a tbb felfel van. Ez a metafora lehetv teszi szmunkra annak kzlst,
hogy az rak emelkedtek, felmsztak vagy rakta mdjra szrnyalnak, hogy a hmrsklet cskken vagy esik,
hogy a bizalom valakiben cskken, illetve hogy egy sztr npszersge megugrott vagy szrnyal.
Az ilyen metafork megkzeltsnek kt mdja lehetsges. Az egyik az, hogy a metafora teljes tudst
beptjk a sztrba j jelentseket adunk az emelkedik, esik, mszik stb. szavakhoz, melyek gy rjk le ket,
hogy mindenfle mrtkre vonatkozhatnak, nem csak a magassgra. Ez a mdszer sok alkalmazs szmra
elegend, de nem ragadja meg a metafora azon generlkpessgt, amely az emberek szmra lehetv teszi j
kifejezsek hasznlatt mint pldul az albukik vagy a kirobbantja a tett anlkl hogy flrertstl
tartannak. A msik mdszer a gyakori metaforkrl explicit tudst illeszt be a rendszerbe, s ezeket hasznlja
az j kifejezsek olvass kzbeni megrtshez. Pldul tegyk fel, hogy egy rendszer ismeri a tbb felfel
van metaforjt. Azaz tudja, hogy az olyan logikai kifejezsek, melyek egy fggleges skln rtelmezett
pontra vonatkoznak, rtelmezhetk egy mennyisgi skla megfelel pontjaira vonatkozknt. Ezek utn az
eladsok magasak kifejezshez tartozna egy Altitude(Sales, High) sz szerinti rtelmezs, amit metafora
segtsgvel Quantity(Sales, Much)-knt rtelmezhetnk.
724
Created by XMLmind XSL-FO Converter.
Kommunikci
ahol a Likelihood lehet valsznsg vagy a preferencik brmilyen szmszer mrtke. Valamilyen
preferencira szksg van, mivel a szintaktikai s szemantikai rtelmezsi szablyok nmagukban nem
tudnak a kifejezshez vagy mondathoz egyetlen helyes rtelmezst meghatrozni. Ezrt rszekre
bontjuk a munkt: a szintaktikai s szemantikai rtelmezs felels a lehetsges rtelmezsek
halmaznak ellltsrt, a tbbrtelmsg feloldsnak folyamata pedig kivlasztja a legjobbat.
Vegyk szre, hogy a szlsaktus szndkrl, s nem csak a beszl ltal kimondott aktulis kijelentsrl
beszlnk. Pldul ha azt halljuk egy politikustl, hogy I am not a crook, akkor lehet, hogy csak 50%
valsznsget adunk annak, hogy a politikus nem bnz, ugyanakkor 99,999%-ot annak, hogy a beszl nem
egy kamps psztorbot (a crook msik jelentse a ford.). Mgis nagyobb valsznsget rendelnk ahhoz az
rtelmezshez, hogy
Assert(Speaker, (Speaker Criminals)
7. Szvegrts
Egy szveg (discourse) a nyelv tetszleges karaktersorozata tipikusan olyan, amelyik hosszabb, mint egy
mondat. A jegyzetek, a regnyek, az idjrs-jelentsek s a prbeszdek mind szvegek. Eddig teljesen
figyelmen kvl hagytuk a szvegek problmit, a nyelv nll mondatokra bontst helyeztk eltrbe,
melyeket in vitro tanulmnyozhattunk. Ez a fejezet a mondatokat termszetes krnyezetkben tanulmnyozza.
Kt rszproblmt fogunk vizsglni: az utalsfeloldst s a koherencit.
7.1. Utalsfelolds
725
Created by XMLmind XSL-FO Converter.
Kommunikci
Az utalsfelolds (reference resolution) egy olyan nvms vagy hatrozott fnvi kifejezs rtelmezse, amely
a vilg egy objektumra utal.16 A felolds a vilgrl szl tudson s a szveg korbbi rszein alapszik.
Vizsgljuk a kvetkez szakaszt:
John flagged down the waiter. He ordered a ham sandwich.
Annak megrtshez, hogy a he a msodik mondatban Johnra utal, meg kellett rtennk, hogy az els mondat
kt szemlyt emlt, valamint azt, hogy John jtssza a vendg szerept, s ezrt valsznleg rendel, mg a pincr
nem. ltalban az utalsfelolds egy hivatkozott kivlasztsa a jelltek listjrl, de nha magban foglalja j
jelltek ltrehozst is. Vegyk pldul a kvetkez mondatot:
After John proposed to Marsha, they found a preacher and got married. For the honeymoon, they went to
Hawaii. (Miutn John megkrte Marsht, talltak egy papot, s sszehzasodtak. Hawaiira mentek nsztra.)
Itt a honeymoon hatrozott fnvi kifejezs egy olyan dologra utal, amire csak implicit mdon utal a
married ige. A they nvms egy olyan csoportra utal, amit explicit mdon nem emltettek eltte: John s
Marsha (de nem a pap).
A legjobb hivatkozott dolog kivlasztsa egy olyan tbbrtelmsg feloldsi folyamat, amely tbbfle
szintaktikai, szemantikai s pragmatikus rtelmezsi informci kombinlsn alapszik. Bizonyos
nyomravezetk knyszerek formjban adottak. Pldul a nvmsoknak nemben s szmossgban egyeznik
kell a hivatkozottakkal: a he pldul utalhat Johnra, de nem Marshra; a they utalhat egy csoportra, de nem
egyetlen szemlyre. A nvmsoknak a reflexivits szintaktikai knyszereinek is meg kell felelnik. Pldul a
he saw him in the mirror mondatban a kt nvmsnak kt klnbz emberre kell vonatkoznia, mg a he saw
himself kifejezsben ugyanarra az emberre kell utalniuk. Vannak a szemantikai konzisztencira vonatkoz
knyszerek is. A he ate it kifejezsben a he nvmsnak olyan dologra kell utalnia, ami eszik, mg az it
olyanra, amit megehetnek.
Bizonyos vezrfonalak olyan preferencik, amik nem llnak mindig fenn. Pldul amikor egyms utni
mondatoknak prhuzamos struktrja van, olyankor elnys, ha a nvmsi utalsok kvetik ezt a struktrt. gy
a
Marsha flew to San Francisco from New York. John flew there from Boston.
mondatokban azt preferljuk, hogy a there San Franciscra utal, mivel az ugyanazt a szintaktikai szerepet tlti
be. Prhuzamos struktra hinyban az alanyt preferljuk a trgy ellenben. gy a
Marsha gave Sally the homework assignment. Then she left.
szvegben Marsha az els mondat alanya, gy a she preferlt elzmnye. Egy msik preferencia annak az
entitsnak az eltrbe helyezse, amelynek a trgyalsa a legnyilvnvalbb. Ha a kvetkez mondatprt
nllan vizsgljuk
Dana dropped the cup on the plate. It broke.
akkor felmerl egy problma: nem vilgos, hogy az it a pohrra vagy a tnyrra utal. Azonban egy nagyobb
kontextusban a tbbrtelmsg felolddik:
Dana was quite fond of the blue cup. The cup had been a present from a close friend. Unfortunately, one day
while setting the table, Dana dropped the cup on the plate. It broke.
Itt a pohr van a figyelem kzppontjban, ezrt ez a preferlt hivatkozott dolog.
Sokfle utalsfelold algoritmust talltak ki. Az egyik els (Hobbs, 1978) figyelemre mlt, mivel egy olyan
mrtk statisztikai ellenrzst vgeztek rajta, ami abban az idben szokatlan volt. Hrom klnbz
szvegfajtt hasznlva Hobbs 92%-os pontossgot mutatott ki. A mdszer azt felttelezte, hogy egy elemz egy
helyes elemzst ksztett, ami azonban nem llt rendelkezsre, ezrt Hobbs kzzel ksztette el az elemzseket.
A Hobbs algoritmus keressknt mkdik: az aktulis mondattl indulva visszafel keres a mondatokban. Ez a
technika biztostja, hogy a legutbbi jellteket vizsglja elszr. Egy mondaton bell szlessgi keresst vgez,
A nyelvszetben az utalst egy olyan dologra, ami mr szerepelt, anafornak (anaphoric reference) nevezzk. Az utalst egy ksbb
szerepl dologra katafornak (cataphoric reference) nevezzk, mint pldul a he nvms a When he won his first tournament, Tiger
was 20.
16
726
Created by XMLmind XSL-FO Converter.
Kommunikci
balrl jobbra haladva. Ez azt biztostja, hogy az alanyokat a trgyak eltt vizsglja. Az algoritmus kivlasztja az
els jelltet, amely a most vzolt knyszereknek eleget tesz.
E nyelvtan szerint a szveg szegmensekbl ll, ahol minden szegmens vagy egy mondat, vagy mondatok egy
csoportja, s a szegmenseket koherenciarelcik (coherence relations) ktik ssze. A Go two blocks. Turn
right szvegben a koherenciarelci az, hogy az els mondat engedlyezi a msodikat: a hallgatnak akkor kell
jobbra fordulnia, miutn ment kt hztmbnyit. Klnbz kutatk koherenciarelcik klnbz kszlett
javasoltk; a 22.21. bra felsorol egy reprezentatv halmazt. Most vizsgljuk meg a kvetkez trtnetet:
1. A funny thing happened yesterday.
2. John went to a fancy restaurant.
3. He ordered the duck.
4. The bill came to $50.
5. John got a shock when he realized he had no money.
6. He had left his wallet at home.
7. The waiter said it was all right to pay later.
8. He was very embarrassed by his forgetfulness.
Itt, az (1) mondat az Evaluation relciban ll a szveg htralev rszvel; (1) a beszl megjegyzse a
szveghez. A (2) mondat engedlyezi a (3)-at, s a (23) pr egytt
okozza (4)-et, azzal az implicit kztes llapottal, hogy Jnos megette a kacst. Ezek utn (24) szolgl a szveg
htralev rsznek alapjul. A (6) mondat az (5) magyarzata, s (56) engedlyezi (7)-et. Vegyk szre, hogy
ez egy Enable, nem Cause, mivel a pincrnek lehetett volna ms reakcija is. Az (57) egytt okozza (8)-at. A
22.13. feladat arra kri majd, hogy rajzolja fel e szveg elemzsi fjt.
22.21. bra - Koherenciarelcik listja (Hobbs, 1990) alapjn. Mindegyik relci kt,
egymst kvet szvegrszlet, S1 s S2 kztt ll fenn.
727
Created by XMLmind XSL-FO Converter.
Kommunikci
A koherenciarelcik szolglnak egy szveg sszektsre. Vezetik a beszlt annak eldntsben, hogy mit
mondjon s mit tekintsen magtl rtetdnek, s segtik a hallgatt a beszl szndknak megrtsben. A
koherenciarelcik a mondatok tbbrtelmsgnek szrjeknt szolglhatnak: nllan a mondatok lehetnek
tbbrtelmek, de ezen tbbrtelm rtelmezsek tbbsge nem illeszthet ssze egy koherens szvegg.
Eddig az utalsfeloldst s a szvegstruktrt kln vizsgltuk. Azonban a kett valjban sszefgg. Grosz s
Sidner (1986) elmlete pldul azzal foglalkozik, hogy a beszl s hallgat figyelme mire koncentrl a szveg
sorn. Elmletk tartalmaz egy vermet, amely fkusztereket (focus spaces) tartalmaz. Bizonyos
megnyilvnulsok a fkusz elmozdulst okozzk egy elem verembe helyezsvel vagy kivtelvel. Pldul az
ttermi trtnetben a John went to a fancy restaurant mondat j fkuszt helyez a verem tetejre. Ezen a
fkuszon bell a beszl egy hatrozott NP-t hasznlhat a the waiter-re trtn utalsra (az a waiter
ltalnos NP helyett). Ha a trtnet folytatdna egy John went home mondattal, akkor a fkuszteret kivenn a
verem tetejrl, s a szveg nem utalhatna tovbb a pincrre a the waiter vagy a he kifejezsekkel.
Helyesen vlasztott ki olyan sszetevket, mint pldul az of the House of Lords PP, br a tradicionlis
elemzssel ellenttesen dolgozik akkor pldul, amikor a the-t a megelz igvel s nem a kvet fnvvel
csoportostja.
A SEQUITUR azon az tleten alapszik, hogy egy j nyelvtan egyben tmr is. A kvetkez kt knyszer betartsa
a legfontosabb: (1) Egymst kvet szimblumok egyetlen prja sem szerepelhet egynl tbbszr a
nyelvtanban. Ha az A B szimblumpr tbb szably jobb oldaln is szerepel, akkor ki kell cserlnnk a prt egy
j, nem zr szimblummal, amit C-nek neveznk, s egy j szablyt kell bevezetnnk, miszerint C A B. (2)
728
Created by XMLmind XSL-FO Converter.
Kommunikci
Minden szablyt legalbb ktszer kell hasznlni. Ha egy C nem zr, csak egyszer szerepel a nyelvtanban, akkor
trlnnk kell a C-re vonatkoz szablyt, s fel kell cserlnnk egyetlen elfordulst a szably jobb oldalval.
Ezt a kt knyszert egy moh keress alkalmazza, amely a berkez szveget balrl jobbra vgignzi, menet
kzben inkrementlisan pti a nyelvtant, s alkalmazza a knyszereket, amint lehetsges. A 22.22. bra mutatja
az algoritmus mkdst az abcdbcabcd szvegen. Az algoritmus egy optimlisan tmr nyelvtant hatroz
meg a szveghez.
A kvetkez fejezetben tovbbi nyelvtant tanul algoritmusokat is ltni fogunk, amelyek valsznsgi alap,
krnyezetfggetlen nyelvtanokkal mkdnek. Most azonban egy olyan nyelvtan tanulsnak problmjt
vizsgljuk meg, amelyet szemantikval terjesztettnk ki. Mivel egy kiterjesztett nyelvtan egyben Horn-klz
logikai program is, ezrt az induktv logikai programozs techniki megfelelk lesznek. A CHILL (Zelle s
Mooney, 1996) egy induktv logikai programozs (ILP), amely pldkbl megtanul egy nyelvtant s egy arra
specializlt elemzt. A clterlet termszetes nyelv adatbzis-lekrdezsek. A tant pldk szfzrek, s a
nekik megfelel lekrdezsek prjait tartalmazzk pldul:
What is the capital of the state with the largest population?
Answer(c, Capital(s, c) Largest(p, State(s) Population(s, p)))
A CHILL feladata, hogy megtanuljon egy Parse(words, query) prediktumot, amely konzisztens a pldkkal, s
remlhetleg ms pldkra is jl ltalnost. Az ILP kzvetlen alkalmazsa ezen prediktum megtanulsra
gyenge teljestmnyt hoz: a kikvetkeztetett elemz csak krlbell 20%-os pontossg. Szerencsre az ILP
tanul algoritmusok fejleszthetk tuds bevitelvel. Ebben az esetben a Parse prediktum nagy rszt logikai
programknt definiltk, s a CHILL feladatt a vezrl szablyok kikvetkeztetsre redukltk, amelyek
segtik az elemzt a klnbz elemzsek kztti vlasztsban. Ezzel a hozzadott httrtudssal a CHILL 70
85% kztti pontossgot r el klnbz adatbzis-lekrdezsi feladatokon.
22.22. bra - Az abcdbcabcd bemeneti szveget elemz nyelvtant tartalmaz Sequiturrendszer futsi lpsei. Egy S-re vonatkoz szablybl indulunk ki, s ezen szably
vghez sorban minden egyes szimblumot hozzadunk. Miutn a hatodik szimblumot
is hozzadtuk, megkapjuk egy ismtld pr els elfordulst: bc. Ezrt a bc mindkt
elfordulst lecserljk egy j nem zrra, A-ra, s egy j szablyt vesznk fel: A
bc. Miutn hrom jabb szimblumot hozzraktunk a bemenethez, a kilencedik a bc
egy jabb ismtlst eredmnyezi, gy jra A-val helyettestjk. Ez az aA kt
elfordulshoz vezet, ezrt egy j nem zrval, B-vel helyettestjk. Miutn a tizedik,
utols szimblumot is hozzraktuk, Bd kt elfordulst kapjuk, ezrt lecserljk ket
egy j nem zrval, C-vel. De B immr csak egyszer szerepel, a C szably jobb oldaln,
ezrt B-t a neki megfelel bvtssel, aA-val cserljk le.
729
Created by XMLmind XSL-FO Converter.
Kommunikci
9. sszefoglals
A termszetes nyelv megrtse az MI egyik legfontosabb rszterlete. tleteket mert a filozfibl s a
nyelvszetbl, valamint a logikai programozs, valsznsgi tudsreprezentci s a kvetkeztets terletnek
technikibl is. Ms MI-terletektl eltr mdon a termszetes nyelv megrtse a tnyleges emberi viselkeds
empirikus vizsglatt ignyli amely komplexnek s rdekesnek bizonyul.
Az gensek jelzseket kldenek egymsnak bizonyos clok elrse rdekben: informlni, figyelmeztetni,
segtsget szerezni, tudst megosztani vagy meggrni valamit. A jelzsek ily mdon val kldst
szlsaktusnak (speech act) nevezzk. Vgs soron minden szlsaktus ksrlet arra, hogy egy msik gens
elhiggyen vagy megtegyen valamit.
A nyelv megllapodson alapul jelzsekbl (signs) ll, melyek jelentst kzvettenek. Sok llat hasznl ilyen
rtelemben jelzseket. Az ember tnik az egyetlen llatnak, aki nyelvtant (grammar) hasznl strukturlt
zenetek vgtelen szm variciinak ellltsra.
A kommunikci hrom lpst ignyel a beszltl, a szndkot egy elkpzels tadsra, a szavak mentlis
ellltst s a szavak fizikai szintzist. Ezek utn a hallgatnak ngy lpst kell vgrehajtania: szlels,
analzis, tbbrtelmsg feloldsa s a jelents beptse. Minden nyelvhasznlat begyazott (situated)
abban az rtelemben, hogy a megnyilatkozsok jelentse fgghet attl a szitucibl, amiben elllnak.
A formlis nyelvszet s a kifejezsstruktra (phrase structure) nyelvtanok (klnsen a
krnyezetfggetlen nyelvtan (context-free grammar)) hasznos eszkzk a termszetes nyelv egyes
aspektusainak kezelsre.
Krnyezetfggetlen nyelv mondatai O(n3) idben elemezhetk a diagramelemz (chart parser)
segtsgvel.
Kzenfekv egy nyelvtan kiterjesztse (augment) annak rdekben, hogy olyan problmkat kezeljnk, mint
az alanyige egyeztetse vagy a nvmsi esetek. A definit klz nyelvtan (definite clause grammar, DCG)
egy olyan formalizmus, amely lehetv teszi a kiterjesztseket. A DCG segtsgvel az elemzs s
szemantikai rtelmezs (st mg a generls is) logikai kvetkeztets segtsgvel elvgezhet.
A szemantikus rtelmezs (semantic interpretation) szintn kezelhet egy kiterjesztett nyelvtannal. Egy
kvzilogikai forma j kzvett lehet a szintaktikai fk s a szemantika kztt.
730
Created by XMLmind XSL-FO Converter.
Kommunikci
731
Created by XMLmind XSL-FO Converter.
Kommunikci
Az els gpestett elemz algoritmusokat Yngve mutatta be (Yngve, 1955). Hatkony algoritmusokat a hatvanas
vek vgn fejlesztettek ki, nhny kisebb jtssal azta (Kasami, 1965; Younger, 1967; Graham s trsai,
1980). A diagramelemznk Early rendszerhez ll a legkzelebb (Early, 1970). Egy j sszefoglal Aho s
Ullman elemzsrl s fordtsrl szl tanulmnyban tallhat (Aho s Ullman, 1972). Maxwell s Kaplan
mutatja meg, hogy a kiterjesztett diagramelemz algoritmus hogyan tehet hatkonny az tlagos esetekben
(Maxwell s Kaplan, 1993). Church s Patil foglalkozik a szintaktikai tbbrtelmsg feloldsval (Church s
Patil, 1982).
A termszetes nyelvek formlis szemantikai rtelmezse a filozfibl s a formlis logikbl ered, s
klnsen szorosan kapcsoldik Alfred Tarskinak a formlis nyelvek szemantikjrl szl munkjhoz
(Tarski, 1935). Bar-Hillel volt az els, aki a pragmatikai elemzs problmjt ttekintette, s azt javasolta, hogy
formlis logikval kezeljk. Pldul bevezette C. S. Pierce referencilis index (indexical) fogalmt a
nyelvszetben (Bar-Hillel, 1954). Richard Montague esszje, az English as a formal language a nyelv logikai
analzisnek egyfajta manifesztuma (Montague, 1970), azonban Dowty s trsainak knyve (Dowty s trsai,
1991), valamint Lewis cikke (Lewis, 1972) sokkal olvasmnyosabb. Thomason szerkesztette Montague
munkinak teljes kollekcijt (Thomason, 1974). A mestersges intelligenciban McAllester s Givan munkja
folytatja a montague-i hagyomnyt sok j technikai rszlet megvilgtsval (McAllester s Givan, 1992).
Egy kzbls, avagy kvzilogikai forma tlete a kvantorok rvnyessgi krhez hasonl problmk kezelsre
Woodsig nylik vissza (Woods, 1978), s sok jelenlegi rendszerben is megtallhat (Alshawi, 1992; Hwang s
Schubert, 1993).
Az els valdi feladatot megold NLP-rendszer valsznleg a BASEBALL krdsvlaszol rendszer volt (Green
s trsai, 1961), amely baseball-statisztikk adatbzisval kapcsolatos krdseket kezelt. Nem sokkal utna
kvetkezett Woods LUNAR rendszere, amely az Apoll program ltal visszahozott kvekkel kapcsolatos
krdseket vlaszolt meg (Woods, 1973). Robert Schank s hallgati tbb programot is ksztettek (Schank s
Abelson, 1977; Wilensky, 1978; Schank s Riesbeck, 1981; Dyer, 1983), amelyek mindegyiknek a nyelv
megrtse volt a feladata. A hangsly azonban kevsb volt magn a nyelven, sokkal inkbb a reprezentcin s
kvetkeztetsen. A problmk kztt volt a sztereotip szitucik reprezentlsa (Cullingford, 1981), az emberi
memriaszervezs lersa (Rieger, 1976; Kolodner, 1983), valamint tervek s clok megrtse (Wilensky,
1983).
A termszetes nyelv generlst az tvenes vekben, a gpi fordts legels napjaitl kezdve figyelembe vettk,
de a hetvenes vekig nem merlt fel egynyelv problmaknt. Simmons s Slocum (Simmons s Slocum, 1972),
valamint Goldman (Goldman, 1975) munkja reprezentatv. A PENMAN (Bateman s trsai, 1989) volt az els
teljes generl rendszer, amely a Szisztematikus Nyelvtanra (Systematic Grammar) (Kasper, 1988) plt. A
kilencvenes vekben kt fontos szabadon elrhet generl rendszer vlt elrhetv, a KPML (Bateman, 1997)
s a FUF (Elhadad, 1993). A generlsrl szl fontos knyvek kztt szerepel (McKeown, 1985; Hovy, 1988;
Patten, 1988; Reiter s Dale, 2000).
A tbbrtelmsg feloldsval foglalkoz egyik legkorbbi munka Wilks elmlete a preferenciaszemantikrl
(preference semantics) (Wilks, 1975), amelyik azokat az rtelmezseket prblta megtallni, amik
minimalizljk a szemantikai anomlik szmt. Hirst egy olyan hasonl cl rendszert r le, amelyik kzelebb
van a fejezetben ismertetett kompozcis szemantikhoz (Hirst, 1987). Hobbs s trsai a szintaktikai s
szemantikai reprezentci minsgt mr kvantitatv keretrendszert rnak le (Hobbs s trsai, 1993). Azta a
Bayes-hlk hasznlata vlt elterjedtebb (Charniak s Goldman, 1992; Wu, 1993). A nyelvszetben az
optimalits elmlete (Kager, 1999) a puha knyszerek nyelvtanba ptsn alapszik, amely termszetes slyt ad
az rtelmezseknek ahelyett, hogy a nyelvtan az sszes lehetsget egyforma sllyal generln. Norvig trgyalja
azokat a problmkat, amelyek egy maximlisan valszn rtelmezs helyett tbb prhuzamos rtelmezs
figyelembevtelbl addnak (Norvig, 1988). Az irodalmi kritika nem egyrtelm a tekintetben, hogy a
tbbrtelmsg megoldand problma vagy dvzlend dolog (Empson, 1953; Hobbs, 1990).
Nunberg a metonmia (metonymy) formlis modelljt vzolja (Nunberg, 1979). Lakoff s Johnson az angol
nyelv gyakori metaforit katalogizlja s magval ragad mdon elemzi (Lakoff s Johnson, 1980). Ortony
metaforrl szl cikkgyjtemnyt mutat be (Ortony, 1979); Martin a metafora rtelmezsnek szmtgpes
megkzeltst adja meg (Martin, 1990).
Az utalsfelolds ltalunk bemutatott kezelse a (Hobbs 1978)-at kveti. A (Lappin s Leass, 1994) ltal
bemutatott sszetettebb megolds egy kvantitatv pontozsi mdszeren alapszik. jabb munkk (Kehler, 1997;
Ge s trsai, 1998) gpi tanulst hasznlnak a kvantitatv paramterek hangolsra. Az utalsfeloldsrl szl
kt kitn ttekints Hirst s Mitkov knyvei (Hirst, 1981; Mitkov, 2002).
732
Created by XMLmind XSL-FO Converter.
Kommunikci
1758-ban David Hume Enquiry Concerning the Human Understanding c. mve amellett rvelt, hogy a nyelvi
szvegeket hrom, az elgondolsok kztti kapcsolatokat ler elv kti/fogja ssze, nevezetesen a Hasonlsg,
az id- vagy trbeli sszefggs s az Ok vagy Okozat. gy kezddtt a koherenciarelcik meghatrozsnak
hossz trtnete. Hobbs (Hobbs, 1990) adja meg neknk a fejezetben hasznlt halmazt; Mann s Thompson
(Mann s Thompson, 1983) egy jobban kifejtett halmazt nyjt, amely magban foglalja a kvetkezket:
megolds-sszetartozs, bizonytk, igazols, motivci, kvetkeztets, sorozat, engedlyezs, kidolgozs,
jrafogalmazs, felttel, krlmny, ok, engedmny, httr, valamint tzis-antitzis. Ez a modell fejldtt a
retorikai struktra elmlett (rhetorical structure theory, RST), amely valsznleg napjaink legkiemelkedbb
elmlete (Mann s Thompson, 1988). Ez a fejezet tvesz egyes pldkat (Jurafsky s Martin, 2000) Andrew
Kehler ltal rt fejezetbl.
Grosz s Sidner bemutat egy fkuszeltolson alapul szvegkoherencia-elmletet (Grosz s Sidner, 1986), s a
(Grosz s trsai, 1995) egy kzppontba lltson alapul hasonl elmletet knl. Joshi, Webber s Sag fontos
korai munkkat gyjt ssze a szvegrtsrl (Joshi, Webber s Sag, 1981). Webber bemutatja olyan szintaxiss szvegknyszerek egymssal kapcsolatban ll modelljt, amely knyszerek a szveg egy adott pontjn
llthat dolgokra vonatkoznak (Webber, 1983), tovbb bemutatja az igeidk s a szveg klcsnhatsi
mdjnak modelljt (Webber, 1988).
Az els fontos eredmny a nyelvtan indukcis (grammar induction) tanulsnak terletn egy negatv
eredmny volt: Gold (Gold, 1967) megmutatta, hogy nem lehetsges megbzhatan egy helyes
krnyezetfggetlen nyelvtan megtanulsa annak szvegei alapjn. Az tlet lnyege szerint ha adott egy s1, s2,
sn fzrhalmaz, akkor a helyes nyelvtan lehet a mindent magba foglal (S word*), vagy a bemenet msolata,
az (S s1 | s2 | | sn), vagy brmi a kett kztt. Jeles nyelvszek, mint pldul Chomsky (Chomsky, 1957;
1980) s Pinker (Pinker, 1989; 2000) felhasznltk Gold eredmnyeit annak megmutatsra, hogy lennie kell
egy rkltt univerzlis nyelvtannak (universal grammar), amellyel minden gyermek szletsnl fogva
rendelkezik. Az gynevezett Ingerszegnysg (Poverty of the Stimulus) rvels szerint a gyerekeknek nincs ms
nyelvi pldjuk, mint pozitv: szleik s trsaik nyelvk legtbbszr pontos pldit lltjk el, s igen ritkn
javtanak ki hibkat. Ezrt, mivel Gold bebizonytotta, hogy pozitv pldkbl nem lehet CFG-t tanulni, a
gyerekeknek mr tudniuk kell a nyelvtant, s pusztn ezen rkltt nyelvtan paramtereit lltjk, illetve a
szkszletet tanuljk. Br ez az rvels mg befolyssal br a Chomskyt kvet nyelvszek krben, egyes
nyelvszek (Pullum, 1996; Elman s trsai, 1997) s a legtbb szmtstudomnnyal foglalkoz elvetette. Igen
hamar, mr 1969-ben Horning megmutatta, hogy meg lehet tanulni PAC rtelemben egy valsznsgi
krnyezetfggetlen nyelvtant. Azta szmos meggyz, kizrlag pozitv pldkbl tanul empirikus
demonstrci jelent meg, mint pldul Mooney, illetve Muggleton s De Raedt ILP-munki (Mooney, 1999;
Muggleton s De Raedt, 1994), valamint Schtze s de Marcken emlkezetes PhD-rtekezsei (Schtze, 1995;
de Marcken, 1996). Ms nyelvtani formalizmusok, mint pldul a regulris nyelvek (Oncina s Garcia, 1992;
Denis, 2001), regulris fa nyelvek (Carrasco s trsai, 1998), valamint a vges automatk (Parekh s Honavar,
2001) tanulsa is lehetsges.
A SEQUITUR-rendszert Nevill-Manning s Witten ksztette (Nevill-Manning s Witten, 1997). rdekes, hogy
k, valamint de Marcken is megjegyezte, hogy nyelvtant kikvetkeztet megoldsaik tmrtsre is jl
hasznlhatk. Ez sszhangban van a minimlis ler hosszsg kdolsnak elvvel: egy j nyelvtan olyan,
amely minimalizl kt mretet: a nyelvtan s a szvegek elemzsi fjnak nagysgt.
A nyelv tanulsra szolgl induktv logikai programozsi munkk kztt van a CHILL rendszer (Zelle s
Mooney, 1996), valamint Mooney s Califf programja (Mooney s Califf, 1995), amely jobban tanult igk mlt
idej alakjra vonatkoz szablyokat, mint a korbbi neurlis hlk s a dntsi fa rendszerek. Cussens s
Deroski tbb cikkgyjtemnyt is szerkesztett, amelyek a nyelvtanulsrl szltak a logikban (Cussens s
Dzeroski, 2000).
Az Association for Computational Linguistics (ACL) rendszeresen rendez konferencikat, s kiadja a
Computational Linguistics folyiratot. Ezenkvl van egy nemzetkzi konferencia a tmban, az International
Conference on Computational Linguistics (COLING). A Readings in Natural Language Processing (Grosz s
trsai, 1986) a terlet sok fontos korai cikkt tartalmaz antolgia. A (Dale s trsai, 2000) az NLP-rendszerek
ptsre szolgl gyakorlati eszkzkre helyezi a hangslyt. Jurafsky s Martin jegyzete alapos bevezett nyjt
a terlethez (Jurafsky s Martin, 2000). Az (Allen, 1995) egy kicsit rgebbi munka. Pereira s Sheiber, valamint
Covington Prolog-implementcikon alapul tmr ttekintst ad (Pereira s Sheiber, 1987; Covington, 1994).
Az Encyclopedia of AI-ben sok hasznos cikk tallhat a terletrl; kiemelend a Computational Linguistics s
a Natural Language Understanding.
733
Created by XMLmind XSL-FO Converter.
Kommunikci
9.2. Feladatok
22.1.
Olvassa el az albbi szveget egyszer, s prbljon meg amennyit csak lehet megjegyezni belle. Ksbb lesz
egy teszt.
Az eljrs valjban igen egyszer. Elszr klnbz csoportokba rendezi a dolgokat. Termszetesen egy
halom elegend lehet attl fggen, hogy mennyi teend van. Ha valahova mshova kell mennie a felszerels
hinya miatt, akkor az a kvetkez lps, klnben mr nagyjbl elkszlt. Fontos, hogy ne vigye tlzsba a
dolgot. Ez azt jelenti, hogy jobb egyszerre kevesebbel foglalkozni, mint tbbel. Rvid tvon ez nem tnhet
fontosnak, de knnyen jelentkezhetnek komplikcik. A hiba is kltsges. Els rnzsre a teljes eljrs
bonyolultnak tnik. Azonban hamarosan az let megszokott dolgv vlik. Nehz a feladat szksgessgnek
brmilyen elmlst is elre ltni, de sosem lehet tudni. Miutn az eljrs befejezdtt, ismt klnbz
csoportokba kell rendezni az anyagokat. Ezek utn a megfelel helykre pakolhatk a dolgok. Vgs soron jra
hasznlni fogjk ket, s a teljes ciklust meg kell majd ismtelni. Mindazonltal, ez az let velejrja.
22.2.
rjon egy nyelvtant a DCG-jellsrendszerrel, amely ugyanolyan, mint az 1, azzal a kivtellel, hogy
kiknyszerti a mondat alanya s igje kztti egyeztetst, gy nem lltja el az I smells the wumpus-t!
22.3.
Terjessze ki az 1 nyelvtant gy, hogy kezelje a nvel-fnv egyeztetseket! Azaz biztostsa, hogy az agents
NP, de az agent s az an agents nem az!
22.4.
Foglalja ssze a legfontosabb klnbsgeket a Java (vagy brmely ms szmtgpes nyelv, amelyet ismer) s a
magyar kztt, megjegyezve a megrts problmjt mindkettre! Gondoljon olyan dolgokra, mint a
nyelvtan, a szintaxis, a szemantika, a pragmatikus elemzs, az sszettelek, a krnyezetfggsg, a lexiklis
tbbrtelmsg, a szintaktikai tbbrtelmsg, az utalsok megtallsa (a nvmsokat is idertve), a httrtuds
s leginkbb arra, hogy mit is jelent megrteni.
22.5.
Melyek indokoljk a kvetkezk kzl a kvzilogikai forma bevezetst?
a. Knnyebben lerhat egyszer sszetteles nyelvtani szablyok.
b. A szemantikai ler nyelv kifejezkpessgnek kiterjesztse.
c. A kvantorok rvnyessgi kre tbbrtelmsgnek (tbbek kztt) tmr formban trtn brzolsa.
d. A szemantikai egyrtelmsts egyszerbb ttele.
22.6.
Hatrozza meg, hogy az ebben a fejezetben tallhat nyelvtan alapjn milyen szemantikai rtelmezs adhat a
kvetkez mondatokhoz:
a. It is a wumpus.
b. The wumpus is dead.
c. The wumpus is in 2,2.
J tlet lenne az It is a wumpus szemantikai rtelmezsnek egyszeren a x x Wumpuses? Fontoljon meg
alternatv mondatokat, mint pldul az It was a wumpus.
22.7.
734
Created by XMLmind XSL-FO Converter.
Kommunikci
V walked
Adv slowly
Prep to
Det the
Noun
supermarket
A kvetkez tr szablyhalmazok melyike lltja el a fenti mondatot az elbbi szkincset hasznlva? Adja
meg a megfelel elemzsi f(ka)t!
(A):
(B):
(C):
S NP VP
S NP VP
S NP VP
NP
Pronoun
NP Pronoun NP
Pronoun
NP Det
Noun
NP Noun
NP Det
NP
VP VP PP
NP Det NP
VP V Adv
VP VP Adv VP V Vmod
Adv
Adv Adv
Adv
VP V
Vmod Adv
Vmod
Adv PP
PP Prep
NP
Vmod Adv
PP Prep
NP
735
Created by XMLmind XSL-FO Converter.
Kommunikci
NP Noun
Adv PP
NP Noun
PP Prep NP
rjon hrom szintaktikailag helyes s hrom helytelen angol mondatot, amelyet a hrom elbbi nyelvtan llt
el! Lnyegben klnbzzenek egymstl, legalbb hat sz hosszak legyenek, s egy teljesen j szkincsre
kell plnik (amit lehetleg n hatrozzon meg). Javasoljon mindhrom nyelvtanra olyan jtst, amely
elkerli a nem helyes mondatok ellltst!
22.10.
Valstsa meg a diagramelemz algoritmus egy olyan vltozatt, amely a teljes bemenetet lefed sszes l
tmrtett fjt adja vissza!
22.11.
Valstsa meg a diagramelemz algoritmus egy olyan vltozatt, amely a leghosszabb bal oldali l tmrtett
fjt adja vissza, s amennyiben ez az l nem fedi le a teljes ft, folytatja az elemzst annak az lnek a vgn!
Mutassa meg, hogy mirt lesz szksg a PREDICT eljrs meghvsra a folytats eltt! A vgeredmny
tmrtett fk egy olyan listja, ahol a teljes lista lefedi a bemenetet.
22.12.
(Barton s trsai, 1987) alapjn. Ez a gyakorlat az ltalunk Buffalon-nek nevezett nyelvvel foglalkozik, ami
nagyon hasonlatos az angolhoz (legalbbis az 0-hoz), azzal a kivtellel, hogy a szkincsben csak egy sz
tallhat: a buffalo. me, kt mondat a nyelvbl:
Buffalo buffalo buffalo Buffalo buffalo.
Buffalo Buffalo buffalo buffalo buffalo Buffalo buffalo.
Arra az esetre, ha nem hinn el, hogy ezek mondatok, lljon itt kt angol mondat ugyanezzel a szintaktikai
struktrval:
Dallas cattle bewilder Denver cattle.
Chefs London critics admire cook French food.
rjon egy nyelvtant a Buffalon szmra! A lexiklis kategrik a vros, a tbbes szm fnv s a (tranzitv) ige,
s egy szablynak kell lennie a mondat, egynek az igei kifejezs s hromnak a kvetkez fnvi kifejezsek
szmra: tbbes szm fnv, fnvi kifejezs, amelyet a vros mint mdost elz meg, s fnvi kifejezs,
amelyet reduklt relatv klz kvet. A reduklt relatv klz egy olyan klz, amelybl hinyzik a relatv nvms.
Emellett a klz egy alanyi fnvi kifejezst kvet trgy nlkli igbl ll. Egy plda a reduklt relatv klzra a
London critics admire a fenti pldban. Foglalja tblzatba a Buffalon lehetsges elemzseinek szmt n =
110-re! Kln pontrt: Carl de Marcken kiszmolta, hogy 121 030 872 213 055 59 681 184 485 olyan
Buffalon mondat van, amely 200 hossz (az ltala hasznlt nyelvtanra). Hogyan csinlta?
22.13.
Rajzolja fel a 7.2. szakasz - Egy koherens szveg struktrja rszben tallhat John egy elegns tterembe
megy trtnet szvegelemzsi fjt! Hasznlja a Segment-re vonatkoz kt szablyt, megadva a helyes
CoherenceRelation-t mindent egyes csompontra! (Nem kell az egyes mondatok elemzseit megmutatnia.)
Most tegye meg ugyanezt egy n ltal vlasztott tetszleges 510 mondat hosszsg szvegre!
22.14.
Elfelejtettk megemlteni, hogy a 22.1. feladat szvegnek cme: Ruhamoss. Olvassa jra a szveget, s
vlaszolja meg a 22.7. feladat krdseit jra! Ezttal jobban ment? Bransford s Johnson (1973) ezt a szveget
hasznlta egy jobban ellenrztt ksrletben, s azt tapasztalta, hogy a cm sokat segtett. Mit mond ez nnek a
szvegrtsrl?
736
Created by XMLmind XSL-FO Converter.
Mivel nem lett volna rtelme lefordtani magyarra az egyes szavakat, ezrt meghagytuk az eredeti angol nyelv pldt. (A ford.)
737
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
planning and scheduling are integrated the success of naive bayes model is just a possible prior source by the
time
Mg a fenti kis plda alapjn is lthatnak kell lennie, hogy a trigram modell jobb, mint a bigram (amely pedig
jobb, mint az unigram), mind az angol nyelv, mind egy MI-tanknyv tmjnak kzeltsben. A modellek
maguk is egyetrtenek ezzel: a trigram modell a vletlen mdon generlt sztringjhez 10 10 valsznsget
rendel, a bigram 1029-et, az unigram pedig 1059-et.
Ez a knyv flmilli szavval nem tartalmaz elg adatot ahhoz, hogy j minsg bigram modellt lehessen
ellltani belle, nem is beszlve a trigram modellrl. A knyv szkincse krlbell 15 ezer klnbz szt
tartalmaz, teht a bigram modell 15 0002 = 225 milli szprt tartalmaz. Vilgos, hogy a szprok legalbb
99,8%-a 0 gyakorisg, de nem akarjuk, hogy a modell azt lltsa, hogy ezek a szprok lehetetlenek.
Szksgnk van valamilyen simtsra (smoothing) a nulla gyakorisgok felett. A legegyszerbb megolds az
adj-hozz-egyet simts (add-one smoothing): minden lehetsges bigram gyakorisghoz hozzadunk egyet.
Azaz amennyiben a korpuszban N sz s B lehetsges bigram tallhat, akkor minden c gyakorisg bigramhoz
egy (c + 1)/(N + B) rtk valsznsg-becslt rendelnk. Ez a mdszer megsznteti a nulla valsznsg ngramok problmjt, de az a kvetelmny, hogy minden gyakorisgot pontosan eggyel kell nvelni, ktsges, s
rossz becslsekhez vezethet.
A msik megkzelts a lineris interpolcin alapul simts (linear interpolation smoothing), ami
linerisan kombinlja a trigam, bigram s unigram modelleket. A valsznsg-becslt a kvetkezkppen
definiljuk:
ahol N a szavak szma. Minl kisebb az sszetettsg, annl jobb a modell. Az az n-gram modell, amely minden
szhoz 1/k valsznsget rendel, k sszetettsg; az sszetettsget gy is lehet rtelmezni, mint tlagos
elgazsi tnyezt.
Pldaknt arra, hogy mire kpesek az n-gram modellek, vegyk a szegmentci (segmentation) feladatt, ami
szhatrok megtallsa szkz nlkli szvegben. Ez a feladat elengedhetetlen a japn s knai nyelv esetn;
ezek olyan nyelvek, amelyek nem raknak szkzt a szavak kz, felttelezzk azonban, hogy a legtbb
olvasnak az angol nyelv2 jobban megfelel. Az
Itiseasytoreadwordswithoutspaces3
mondatatot tnyleg knny elolvasni. Az olvas arra gondolhat, hogy ezt az teszi lehetv, hogy teljesen
ismerjk az angol szintaktikt, szemantikt s pragmatikt. Meg fogjuk mutatni, hogy a mondatot egy egyszer
unigram modellel is knnyen dekdolni lehet.
Korbban lthattuk, hogy a Viterbi algoritmus (15.9) hogyan hasznlhat a legvalsznbb szekvencia
megtallsra egy sz-valsznsgi hlban. A 23.1. brn lthat a Viterbi algoritmus olyan vltozata,
amelyet specifikusan a szegmentcis problma megoldsra terveztnk. Bemenete a P(sz) unigram
valsznsgi eloszls s egy karakterfzr. Ezutn az algoritmus a karakterfzr minden egyes i pozcijra a
Mivel nem lehetett volna hasonl magyar pldt valsznsgekkel egytt elkszteni, ezrt meghagytuk az eredeti angol nyelv pldt. (A
ford.)
3
Knnyszavakatszkzknlklolvasni (A ford.)
2
738
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
legjobb[i] elemben eltrolja a legvalsznbb i-ig tart karakterfzr valsznsgt. Emellett a szavak[i]
elemben eltrolja azt az i-edik pozciban vgzd szt, ami a legnagyobb valsznsget adta. Miutn
felptette a legjobb s a szavak tmbket dinamikus programozsi mdon, htrafel mozogva feldolgozza a
szavak tmbt, hogy megtallja a legjobb utat. Ebben az esetben, a knyv unigram modellje alapjn a legjobb
szekvencia tnylegesen az It is easy to read words without spaces, 4 1025 valsznsggel. A szekvencia
rszeinek sszehasonltsa sorn lthat, hogy az easy unigram valsznsge 2,6 10 4, mikzben az
alternatv e as y5 valsznsge sokkal kisebb, 9,8 1012 annak ellenre, hogy a knyv kpleteiben viszonylag
gyakran elfordul az e s az y. Hasonlkppen:
P(without) = 0,0004
P(with) = 0,005; P(out) = 0,0008
P(with out) = 0,005 0,0008 = 0,000004
Ennek kvetkeztben az unigram modell szerint a without szzszor nagyobb valsznsg, mint a with
out.6
Ebben a bekezdsben a szavak feletti n-gram modellekrl rtekeztnk, azonban az n-gram modelleket szmos
egyb egysg pldul karakterek vagy beszdrszek (parts of speech) felett is lehet rtelmezni.
739
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
trsi szablyhoz valsznsget rendelnk. Az azonos bal oldallal rendelkez szablyok valsznsgnek
sszege 1. A 23.2. brn az 0 nyelvtan egy rszletnek PCFG-je lthat.
23.3. bra - A Minden wumpus bzlik mondat elemzsi fja, megadva minden egyes
rszfa valsznsgt. A teljes fa valsznsge 1,0 0,5 0,05 0,15 0,60 0,10 =
0,000225. Mivel a mondatnak ez az egyetlen elemzse, ezrt ennyi a mondat
valsznsge is.
Valsznsgi nyelv-feldolgozs
szorzata. A 23.3. bra bemutatja, hogyan lehet kiszmtani egy mondat valsznsgt. A valsznsg
kiszmthat egy CFG diagramelemz alkalmazsval, amely megadja az sszes lehetsges elemzst, majd
egyszeren ssze kell adni a valsznsgeket. Azonban ha csak a legvalsznbb elemzs rdekel minket,
akkor a nem valszn elemzsek meghatrozsa pazarls. A legvalsznbb elemzs hatkony megtallsra
hasznlhatunk egy Viterbi algoritmus varicit vagy egy legjobbat-elszr keressi technikt (mint pldul az
A*-ot).
A PCFG-vel az a problma, hogy krnyezetfggetlen. Ez azt jelenti, hogy a klnbsg a P(eat a banana) s a
P(eat a bandanna)8 kztt mindssze a P(banana) s P(bandanna) kzti klnbsgtl fgg, s nem az
enni ige s a megfelel objektumok kzti kapcsolattl. Hogy megkapjuk ezt a kapcsolatot, szksg van
valamilyen krnyezetfgg modellre, mint pldul a szkinccsel elltott PCFG-re (lexicalized PCFG),
amelyben a kifejezs feje9 szerepet jtszhat a kifejezs valsznsgnek meghatrozsban. Elegend tant
adat esetn a VP VP NP szably kondicionlhat a begyazott VP fejre (enni) s az NP fejre (bann).
Ezltal a szkinccsel elltott PCFG-k kpesek az n-gram modellek kzs elfordulsi megszortsai egy
rsznek a megragadsra, megtartva a CFG-modellek nyelvtani megszortsait.
A PCFG msik problmja az, hogy ersen preferlja a rvid mondatokat. Egy olyan korpuszban, mint a Wall
Street Journal, az tlagos mondathossz krlbell 25 sz. Azonban egy PCFG ltalban gy vgez, hogy
viszonylag magas valsznsget rendel olyan szablyokhoz, mint az S NP VP, az NP Pronoun s a VP
Verb. Ez azt jelenti, hogy a PCFG viszonylag nagy valsznsget fog rendelni sok rvid mondathoz, mint pl.
aludt, azonban a Journalban sokkal valsznbben tallkozunk olyan mondatokkal, mint Egy megbzhat
kormnyzati forrs jelentse szerint az az llts, hogy aludt, hihet. gy tnik, hogy a Journal mondatai
igazbl nem krnyezetfggetlenek, hanem az rknak van elkpzelsk az elvrt mondathosszrl, amit fel is
hasznlnak lgy globlis knyszerknt a mondatok rsakor. Ezt nehz visszatkrzni egy PCFG-ben.
741
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
ahol X, Y s Z nem zr, mg t zr szimblum. Minden krnyezetfggetlen nyelvtant t lehet rni Chomsky
norml alakra, amely pontosan ugyanazt a nyelvet fogadja el. Ezutn nhatalmlag n nem zr szimblumra
szortkozhatunk, ezltal n3 + nv szablyt kapunk, ahol v a zr szimblumok szma. A gyakorlatban ez a
mdszer csak kis nyelvtanok esetn bizonyult hatkonynak. A bayesi modellsszevons (Bayesian model
merging) alternatv megkzelts hasonl a SEQUITUR modellhez (lsd 22.8. alfejezet). A mdszer
mondatonknti loklis modellek (nyelvtanok) ptsvel kezd, majd a minimlis lerhossz felhasznlsval
sszevonja a modelleket.
2. Informcikeress
Az informcikeress (information retrieval) feladata olyan dokumentumok megtallsa, amelyek relevnsak
a felhasznl informciignyre nzve. Az informcikeres rendszerek legjobban ismert pldi a vilghl
keresgpei. A felhasznl megadhat egy lekrdezst mint pldul [MI-knyv] a keresgpnek, majd
megnzheti a relevns oldalak listjt. Ebben az alfejezetben bemutatjuk, hogyan plnek fel ezek a rendszerek.
Egy informcikeres (ezentl IR-) rendszer a kvetkez mdokon jellemezhet:
Dokumentumgyjtemny. Minden rendszernek el kell dntenie, hogy mit kezel dokumentumknt: egy
bekezdst, egy oldalt vagy egy tbboldalas szveget.
Lekrdeznyelven megadott krds. A lekrdezs (query) rja le, hogy a felhasznl mit szeretne
megtudni. A lekrdeznyelv (query language) lehet egyszeren szavak listja (pl. [MI-knyv]); vagy meg
lehet adni egyms mellett ll szavakbl ll kifejezst (pl. [MI-knyv]); logikai opertorokat tartalmazhat
(pl. [MI S knyv]), nem logikai opertorokat (pldul [MI KZELBEN knyv] vagy [MI knyv
CM:www.aaai.org]) foglalhat magban.
Eredmnyhalmaz. Ez a dokumentumok azon rszhalmaza, amit az IR a keress alapjn relevnsnak
(relevant) tl. Relevnson azt rtjk, hogy valsznleg hasznos lesz a krdst feltev szemly szmra, arra
a bizonyos informciignyre, amelyet a lekrdezsben fogalmazott meg.
Az eredmnyhalmaz megjelentse. Ez lehet olyan egyszer, mint a dokumentumcmek rendezett rangsorolt
listja, vagy olyan bonyolult, mint az eredmnyhalmaz hromdimenzis trbe vettett, forg sznes trkpe.
Az elz fejezet elolvassa utn gondolhatunk arra, hogy egy informcikeres rendszert gy is felpthetnk,
hogy a dokumentumhalmazt elemzs utn lekpezzk logikai mondatok tudsbzisba, majd elemezzk a
krdseket, s MEGKRDEZ-zk a tudsbzist, hogy a vlaszokat megkapjuk. Sajnos senkinek sem sikerlt gy
mkd, nagymret IR-rendszert ksztenie. Egyszeren tl bonyolult olyan szkincset s nyelvtant pteni,
amely kpes nagy dokumentumhalmazokat lefedni, gy minden IR-rendszer egyszerbb nyelvi modellt hasznl.
A legkorbbi IR-rendszerek a Boole-kulcssz modell (Boolean keyword model) szerint mkdtek. A
dokumentumgyjtemny minden egyes szavt gy kezelik, mint egy Boole-tulajdonsgot, amely igaz, ha a sz
elfordul a dokumentumban, s hamis, ha nem. Azaz a visszakeress tulajdonsg igaz erre a fejezetre, de
hamis a 15. fejezetre. A lekrdeznyelv a tulajdonsgok feletti logikai kifejezsek nyelve. Pldul az
[informcikeress S lekrdezs] lekrdezs igaz erre a fejezetre, de nem igaz a 15. fejezetre.
742
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
Ez a modell rendelkezik azzal az elnnyel, hogy knny elmagyarzni s megvalstani. Azonban rendelkezik
nhny htrnnyal is. Elszr, a dokumentum relevancija egyetlen bit, gy nincs semmilyen irnymutats arra,
hogy hogyan rendezzk a megjelents sorn a relevns dokumentumokat. Msodszor, a logikai kifejezsek
szokatlanok lehetnek a nem programoz vagy nem logikval foglalkoz felhasznlk szmra. Harmadszor,
mg egy gyakorlott felhasznl szmra is nehz lehet a megfelel lekrdezst megfogalmazni. Ttelezzk fel,
hogy az [informcikeress S modellek S optimls] krdst tesszk fel, s res eredmnyhalmazt kapunk
vissza. Megprblhatjuk az [informcikeress VAGY modellek VAGY optimls] lekrdezst, azonban ha tl
sok eredmnyt ad vissza, akkor nehz megmondani, mit kell utna kiprblni.
A legtbb IR-rendszer a szavak elfordulsi statisztikjra (s esetleg ms alacsony szint jellemezkre) pt.
Bemutatunk egy valsznsgi keretrendszert, amely jl illeszkedik a trgyalt nyelvi modellekhez. Az alaptlet
az, hogy egy adott lekrdezshez meg akarjuk tallni azokat a dokumentumokat, amelyek relevnsak. Ms
szavakkal, ki akarjuk szmolni a:
P(R = igaz|D, Q)
rtket, amelyben D a dokumentum, Q a lekrdezs, R pedig egy vletlen logikai vltoz, amely a relevancit
fejezi ki. Ha meghatroztuk ezt az rtket, alkalmazhatjuk a valsznsgi rendezsi elvet, amely szerint
amennyiben be kell mutatnunk az eredmnyhalmazt, akkor azt cskken valsznsg relevancia szerint kell
tennnk.
Szmos lehetsg ltezik a P(R = igaz|D, Q) egyttes eloszls dekomponlsra. Itt az n. nyelvi modellezs
(language modeling) megkzeltst fogjuk bemutatni, amely minden egyes dokumentumra egy nyelvi modellt
becsl, majd az adott dokumentum nyelvi modellje alapjn minden egyes lekrdezsre kiszmtja a lekrdezs
valsznsgt. Az R = igaz rtk jellsre r-t hasznlva, a kvetkez alakra rhatjuk t a valsznsget:
P(r|D, Q) = P(D, Q|r)P(r)/P(D, Q) (a Bayes-szably alapjn)
= P(Q, D|r)P(D|r)P(r)/PP(D, Q) (a lncszably alapjn)
= P(Q|D,r)P(r|D)/P(D, Q) (a Bayes-szably alapjn, rgztett D-re)
Azt mondtuk, hogy a P(r|D, Q) rtkt akarjuk maximalizlni, azonban ezzel ekvivalens, ha a P(r|D, Q)/P(r|D,
Q) valsznsgi arnyt maximalizljuk. Azaz a dokumentumokat a kvetkez pontszm alapjn
rangsorolhatjuk:
Ennek az az elnye, hogy kikszbli a P(D, Q) tagot. Most pedig felttelezzk, hogy az irrelevns
dokumentumokra a dokumentum fggetlen a lekrdezstl. Ms szavakkal, amennyiben egy dokumentum
irrelevns egy adott lekrdezsre, akkor a dokumentum ismerete nem fog segteni a lekrdezs
meghatrozsban. Ezt a lekrdezst a kvetkez egyenlet rja le:
P(D, Q|r) = P(D|r)P(Q|r)
Valsznsgi nyelv-feldolgozs
Vgre kszen llunk, hogy ezeket a matematikai modelleket egy pldra alkalmazzuk. A 23.4. bra a [Bayes
informational retrieval model] ([Bayes informcikeress modell]) lekrdezs szavainak ennek a knyvnek t
kivlasztott fejezetbl ll dokumentumgyjtemny feletti unigram statisztikjt adja meg. Feltesszk, hogy a
fejezetek azonos minsgek, gy csak azt kell kiszmolnunk, hogy mennyi a lekrdezs valsznsge az adott
dokumentum esetn, minden egyes dokumentumra. Kt alkalommal tesszk ezt meg, egyszer egy Di simtatlan
maximum-likelihood becslvel, majd egy
adj-hozz-egyet simt becslj modellel. Azt tteleznnk fel,
hogy egy ilyen keressnl ez a fejezet lesz elsnek rangsorolva, s valban ez gy is van mindkt modell
szerint.
A simtott modell rendelkezik azzal az elnnyel, hogy kevsb rzkeny a zajra, s hogy nemzrus relevanciavalsznsget kpes rendelni olyan dokumentumokhoz, amelyek nem tartalmazzk az sszes szt. A simtatlan
modellnek az az elnye, hogy knny sok dokumentumot tartalmaz gyjtemnyekre kiszmolni: ha
elksztnk egy olyan indexet, amely megadja, hogy az adott szt mely dokumentumok tartalmazzk, akkor
gyorsan el tudjuk lltani az eredmnyhalmazt ezeknek a listknak a metszeteknt, s a P(Q|Di) rtkeket csak
a metszetben szerepl dokumentumokra kell kiszmolni, nem pedig mindegyikre.
10
Egy kutya megharapott egy embert, illetve egy ember megharapott egy kutyt, jellemz jsgcmstlus. (A ford.)
744
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
745
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
algoritmusok igen (nem kell eltvoltani az -ing kpzt, ha a sz mr szerepel a sztrban). Br az angol nyelv
esetn a sztvestsnek csak kis hatsa van, sokkal fontosabb ms nyelvek esetn. A nmet nyelvben gyakran
tallkozhatunk olyan szavakkal, mint Lebensversicherungsgesellschattsangestellter (letbiztost cg
alkalmazottja). Az olyan nyelvek, mint a finn, a trk, az inuit vagy a jupik rekurzv morfolgiai szablyokkal
rendelkeznek, amelyek elmletileg korltlan hosszsg szavakat generlnak.
A kvetkez lps a szinonimk (synonyms) felismerse, mint amilyen a dvny s a kanap. A
sztvestshez hasonlan ez is a felidzs kismrtk nvekedst eredmnyezheti, azonban a pontossgot
veszlyezteti, ha tl agresszven alkalmazzuk. Akik Tim Couch futballistra kvncsiak, nem szeretnnek
tvergdni a kanapkrl (couch kanap) szl dokumentumokon. Az a problma, hogy a nyelv ugyangy
irtzik az abszolt szinonimktl, mint ahogy a termszet retteg a vkuumtl (Cruse, 1986). Azaz, amennyiben
kt sz azonos dolgot jelent, a nyelv beszli trekednek a jelents mdostsra, hogy megszntessk a
zrzavart.
Szmos IR-rendszer bizonyos mrtkig sz bigramokat hasznl, azonban csak nhnyuk valst meg egy teljes
valsznsgi bigram modellt. A helyesrs-javt (spelling correction) eljrsok alkalmazhatk mind a
dokumentumok, mind a lekrdezsek hibinak javtsra.
Vgs finomtsknt az IR-rendszerek tkletesthetk metaadatok (metadata) figyelembevtelvel, amelyek a
dokumentum szvegn kvl ll adatok, mint pldul emberek ltal megadott kulcsszavak vagy
dokumentumok kztti hypertext-hivatkozsok.
746
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
modell generlta-e, s mert egy sokkal tbb dimenzis trrel kell elbnnunk. Szmos megkzeltst dolgoztak
ki.
Az agglomeratv klaszterezs (agglomerative clustering) klaszterekbl ll ft pt, lemenve egszen az
egyedi dokumentumok szintjre. A fa brmely szinten nyeshet, hogy kevesebb kategrit kapjunk, de ezt az
algoritmuson kvl vesszk figyelembe. Az elejn minden dokumentumot kln klaszternek tekintnk. Ezutn
megkeressk azt a kt klasztert, melyek egy bizonyos tvolsgmrtk szerint legkzelebb llnak egymshoz, s
sszevonjuk ket. Addig ismteljk a folyamatot, amg csak egy klaszter marad. A kt dokumentum tvolsgt
meghatroz mrtk a dokumentumok szavai kzti tfeds valamilyen mrtke. Pldul reprezentlhatjuk a
dokumentumot szgyakorisgok vektoraknt, ahol a tvolsgot a kt vektor euklideszi tvolsgaknt
rtelmezzk. Kt klaszter tvolsga a klaszterek medinjainak tvolsgaknt rtelmezhetjk, vagy a klaszterek
elemeinek tlagos tvolsgt vehetjk figyelembe. Az agglomeratv klaszterezs idignye O(n2), ahol n a
dokumentumok szma.
A k-kzp klaszterezs (k-means clustering) pontosan k darab kategria halmazt lltja el. A kvetkez
elven mkdik:
1. Vegynk vletlenszeren k dokumentumot a k kategria reprezentlsra.
2. Rendeljnk minden dokumentumot a legkzelebbi kategrihoz.
3. Szmoljuk ki minden egyes kategria tlagt, s hasznljuk a k tlagot a k kategrik j rtkeinek
reprezentlsra.
4. Ismteljk a 2-es s 3-as lpseket, amg konverglnak.
A k-kzp mdszer O(n) idigny, ez az egyetlen elnye az agglomeratv klaszterezshez kpest. ltalban
kevsb pontos, mint az agglomeratv klaszterezs, br egyesek szerint majdnem olyan hatkony (Steinbach s
trsai, 2000).
Az alkalmazott klaszterezsi mdtl fggetlenl van mg egy feladat, amit el kell vgeznnk, mieltt a
klaszterezst az eredmnyhalmaz bemutatsra hasznlhatjuk: a klaszter j lersnak megtallsa. Az
osztlyozs esetn a kategrik elre definiltak (pldul jvedelmek), mg a klaszterezs esetn ki kell
tallnunk a kategrianeveket. Az egyik vlaszts a klaszter szempontjbl reprezentatv szavak listjnak
hasznlata. A msik lehetsg a klaszter kzppontjhoz kzel lev egyik dokumentum cmnek a hasznlata.
747
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
vektor rja le, amelyben az tlet az, hogy minden egyes szhoz kln dimenzi tartozik, s a lekrdezs
vektorban minden dimenzi 0 rtk, kivve azt a ngy szt, amely a lekrdezsben elfordul. A relevns
dokumentumokat gy kapjuk meg, hogy megkeressk azokat a dokumentumokat, amelyek a lekrdezs
vektornak legkzelebbi szomszdai a vektortrben. A hasonlsg egyik lehetsges mrtke a lekrdezs- s
dokumentumvektor skalris szorzata: minl nagyobb ez a szorzat, annl kzelebb van egymshoz a kt vektor.
Algebrailag ez a mrtk nagy pontszmot ad azoknak a szavaknak, amelyek mind a dokumentumokban, mind a
lekrdezsben gyakran elfordulnak. Geometriailag a kt vektor skalris szorzata az ltaluk bezrt szg
koszinusza, azaz ha kt ilyen vektor koszinuszt maximalizljuk (amennyiben azonos kvadrnsban tallhatk),
akkor az ltaluk bezrt szg nullhoz kzeli lesz.
A vektortr modell ennl sokkal tbbre kpes. A gyakorlatban szmos jellemzvel, finomtssal, javtssal s
kiegsztssel lett kibvtve. Az az alaptlet, miszerint a dokumentumokat a vektortrbeli hasonlsguk alapjn
lehet rangsorolni, lehetv teszi, hogy j tleteket ptsnk be a numerikus sorrendez rendszerbe. Egyesek azt
lltjk, hogy a valsznsgi modell ezeket a mdostsokat sokkal tisztbb elvi alapokon llva tenn lehetv,
azonban az IR-kutatk nem fognak vltani, amg nem ltnak egyrtelm teljestmnyjavulst a msik modellhez
kpest.
Hogy egy tlagos IR-feladat indexelsi problmjnak nagysgrendjt rzkeltessk, vegynk egy szabvnyos
TREC (Text REtrieval Conference Szveg-visszakeressi Konferencia) dokumentumgyjtemnyt, amely 750
ezer dokumentumot tartalmaz, szszesen 2 GB (gigabjt) szveggel. A szkincs krlbell 500 ezer szt
tartalmaz, sztvests s kisbet-nagybet konverzi utn; ennyi sz trolsa 7 s 10 MB kztti trterletet
ignyel. Az invertlt index a (dokumentum, gyakorisg) prokkal 324 MB terletet ignyel, br tmrtsi
technikk alkalmazsval csak 83 MB-ot. A tmrts trhelyet takart meg, a feldolgozsi kvetelmnyek
kismrtk nvelse rn. Azonban ha a tmrts lehetv teszi, hogy az egsz indexet a memriban s nem
httrtron troljuk , akkor jelents ered teljestmnynvekedst kapunk. A kifejezslekrdezs tmogatsa a
trignyt 1200 MB-ra nveli tmrtetlen, illetve 600 MB-ra tmrtett esetben. A webes keresgpek
hromezerszer ekkora feladattal dolgoznak. A legtbb problma az esetkben is hasonl, azonban nem praktikus
terabjtnyi mennyisg adatot kezelni egyetlen szmtgpen, ezrt az indexet k szegmensre vgjk, s minden
szegmenst kln szmtgp trol. A lekrdezst mindegyik szmtgp megkapja, majd a k eredmnyhalmazt
egy eredmnyhalmazba vonjk ssze, amelyet megjelentenek a felhasznl szmra. A webes keresgpeknek
radsul msodpercenknt tbb ezer lekrdezst kell kiszolglniuk, gy a k szmtgp n msolatra van
szksg. Az id folyamn k s n folyamatosan nvekszik.
3. Informcikinyers
Az informcikinyers (information extraction) adatbzis-bejegyzsek ellltsnak a folyamata, amely
sorn egy szveget egy adott osztlyba tartoz objektum vagy esemny elfordulsait, valamint az objektumok
s esemnyek kzti relcikat keresve tfutunk. Megprblhatjuk konkrt cmek kinyerst weboldalakrl,
748
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
adatbzismezkkel az utca, az llam s az irnytszm szmra, vagy konkrt viharok adatainak a kinyerst
idjrs-jelentsekbl, mezkkel a hmrsklet, a szlsebessg s a csapadk szmra. Az informcikinyer
rendszerek flton llnak az informcikeres rendszerek s a teljes nyelvi elemzk kztt, hiszen tbbet kell
tennik, mint egyszeren szzsknak tekinteni a dokumentumot, de kevesebbet, mint minden egyes mondat
teljes nyelvtani elemzst.
Az informcikinyer rendszerek legegyszerbb tpust attribtumalap (attribute-based) rendszernek
nevezzk, mert felttelezi, hogy a teljes szveg egy objektumrl szl, s a feladat ezen objektum
attribtumainak kinyerse. Pldul a 10.5. alfejezetben megemltettk a 17 hvelykes SXGA Monitor
mindssze 249,99 $-rt szvegbl az albbi adatbzis-relci kinyersnek problmjt:
m m SzmtgpMonitorok Mret(m, Hvelyk(17)) r(m, $(249,99))
Felbonts(m, 1280 1024)
Ennek az informcinak egy rsze regulris kifejezsekkel (regular expression) kezelhet, amelyek regulris
nyelvtant definilnak egy karakterfzrben. Regulris kifejezseket hasznlnak olyan Unix-parancsokban, mint
a grep, olyan programozsi nyelvekben, mint a Perl, valamint olyan szvegszerkesztkben, mint a Microsoft
Word. A rszletek eltrk az egyes eszkzkben, s legjobban a megfelel tmutatbl tanulhatk meg,
azonban itt bemutatjuk, hogyan lehet regulris kifejezseket pteni dollrban megadott rakra, bemutatva a
kzs rszkifejezseket:
[0-9] megfelel brmely 0 s 9 kzti szmjegynek
[0-9] + megfelel egy vagy tbb szmjegynek
.[0-9] [0-9] megfelel szmjegyek ltal kvetett pontnak
(.[0-9] [0-9]) ? megfelel szmjegyek ltal kvetett pontnak vagy
res fzrnek
$[0-9] + (.[0-9][0-9])? megfelel 249,99 $-nak, vagy 1,23 $-nak, vagy
1 000 000 $-nak, vagy
Az attribtumalap informcikinyer rendszerek regulris kifejezsek sorozatbl pthetk fel, ahol minden
egyes attribtumhoz egy regulris kifejezs tartozik. Ha a regulris kifejezs pontosan egyszer illeszkedik a
szvegre, akkor kivehetjk a szveg illeszked rszt, amely az attribtum rtke lesz. Ha nincs illeszkeds,
akkor nem tudunk mit tenni, azonban ha tbb illeszkeds is van, akkor szksgnk van egy eljrsra, hogy
hogyan vlasszunk kzlk. Az egyik megolds szerint minden egyes attribtumhoz tbb regulris kifejezst
rendelnk, priorits szerint sorba rendezve. Pldul a legnagyobb priorits rra vonatkoz regulris kifejezs a
dollrjel eltti r: karakterfzrre kereshet, ha ezt nem tallja meg, akkor tlpnk egy kevsb megbzhat
regulris kifejezsre. Egy msik stratgia az sszes tallat kinyerse, majd valamilyen mdon vlasztani
kzlk. Pldul vehetjk azt a legalacsonyabb rat, amely a legnagyobbnak legalbb fele. Ez a megolds
kezelni tudja az olyan szvegeket, mint a Listar 99,00 $, akcis r 78,00 $, szllts 3,00 $.
Az attribtumalap rendszereknl eggyel sszetettebbek a relcis alap informcikinyer rendszerek,
amelyeknek tbb mint egy objektummal kell foglalkozniuk, radsul a kztk lev relcikat is figyelembe kell
vennik. Azaz, amikor egy ilyen rendszer a 249,99 $ szveget ltja, akkor nem csak azt kell megllaptania,
hogy ez egy r, hanem azt is, hogy mely objektumnak az ra. A FASTUS egy tipikus relcis alap
informcikinyer rendszer, amely cgegyeslsekrl s felvsrlsokrl szl hreket kpes kezelni. El tudja
olvasni a kvetkez hrt:
Bridgestone Sports Co. said Friday it has set up a joint venture in Taiwan with a local concern and a Japanese
trading house to produce golf clubs to be shipped to Japan. 14
s egy a kvetkezhz hasonl adatbzisrekordot tud ltrehozni:
e VegyesVllalat Termk(e, Golftk) Dtum(e, Pntek)
A Bridgestone Sports Vllalat pnteken azt nyilatkozta, hogy vegyes vllalatot hozott ltre egy helyi konszernnel s egy japn
kereskedhzzal Tajvanon, hogy Japnba sznt golftket gyrtsanak. A golf club ktrtelm, itt golft. (A ford.)
14
749
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
Entits(e, Bridgestone Sports Co.) Entits(e, egy helyi konszern)
Entits(e, egy japn kereskedhz)
A szablyokat gondosan kell megalkotni, majd ellenrizni kell a felidzst s a pontossgot. Az egyik
kereskedelmi rendszer az Intel Chairman Andy Grove16 szveget szemly helyett helyknt ismerte fel, az
egyik szably miatt:
NagybetvelKezddSz + (Grove | Forest | Village | )
A harmadik lps az alapcsoportok (basic groups) kezelse, amelyek fnvi s igei csoportokat jelentenek. A
lps lnyege, hogy ezeket darabokra kell vgni, hogy a ksbbi lpsek kezelhessk ket. A fnvi csoport a
fejszerepet betlt fnvbl ll, amelyet opcionlisan megelzhetnek nvelk s egyb mdostk. Mivel a
fnvi csoport nem tartalmazza az NP 1-beli teljes komplexitst, ezrt nincs szksg rekurzv
krnyezetfggetlen nyelvtani szablyokra, a vges automatk ltal megengedett regulris nyelvtanok is
elgsgesek. Az igei csoport az igbl s a hozz kapcsold segdigkbl, valamint hatrozkbl ll, azonban
nem tartalmazza a kzvetlen s kzvetett trgyakat s az elljri kifejezseket. Az elbbi pldamondat a
kvetkez mdon kerlne ki ebbl a lpsbl:
1 NG: Bridgestone Sports 10 NG: a local concern
Co.
2 VG: said
11 CJ: and
3 NG: Friday
12 NG:
house
4 NG: it
13 VG: to produce
15
16
Japanese
trading
750
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
15 VG: to be shipped
7 PR: in
16 PR: to
8 NG: Taiwan
17 NG: Japan
9 PR: with
szably a vegyes vllalat ltrehozsnak egyik lehetsges lersa. A kaszkdban ez az els lps, amely
eredmnyt nemcsak a kimenetre, hanem adatbzissmkba is elhelyezi.
Az utols lps az elz lps ltal felptett struktrkat vonja ssze (merges structures). Amennyiben a
kvetkez mondat azt lltja, hogy A vegyes vllalat janurban kezdi meg a termelst, akkor ez a lps
felismeri, hogy kt hivatkozs trtnt a vegyes vllalatra, amelyeket ssze kellene vonni.
ltalnossgban az informcikinyers jl mkdik egy olyan korltozott trgyterlet esetn, amelyben a
trgyalt tmkat elre meg lehet llaptani, tovbb azt is lehet tudni, hogy hogyan rnak rluk. Szmos
trgyterleten hasznlhatnak bizonyult ez a technika, azonban nem lehet a teljes termszetes nyelvi elemzs
helyettestje.
4. Gpi fordts
A gpi fordts (machine translation) egy termszetes nyelv szveg egyik nyelvrl (forrs) egy msik nyelvre
(cl) trtn automatikus fordtsa. Ez a folyamat szmos feladatra alkalmasnak bizonyult, belertve a
kvetkezket:
1. Nyersfordts (rough translation), amelyben a cl pusztn az, hogy egy passzus lnyegt megkapjuk.
Nyelvtanilag helytelen s nem elegns mondatokat is elfogadunk, mindaddig, amg a jelents vilgos.
Pldul a webszrfzs sorn a felhasznl gyakran rl az idegen nyelv weboldal nyersfordtsnak. Az
esetek egy rszben egy egynyelv ember utlagosan szerkesztheti a kimenetet, az eredeti szveg
elolvassnak szksgessge nlkl. A gppel tmogatott fordts ezen tpusa azrt takart meg pnzt, mert az
ilyen szerkesztknek kevesebbet kell fizetni, mint a ktnyelv fordtknak.
2. Korltozott forrs fordtsa (restricted-source translation), amelyben a forrsszveg tmja s
formtuma szigoran korltozott. Az egyik legsikeresebb plda a TAUM-METEO rendszer, amely idjrsjelentseket fordt angolbl francira. Azrt mkdik, mert az idjrs-jelentsek nyelvezete ersen stilizlt
s regulris.
3. Elre szerkesztett fordts (preedited translation), amelyben egy ember gy szerkeszti meg elre a
forrsdokumentumot, hogy megfeleljen az angol nyelv (vagy brmely forrsnyelv) egy korltozott
rszhalmaznak. Ez a megkzelts klnsen akkor kltsghatkony, amikor egyetlen dokumentumot sok
nyelvre kell lefordtani, mint pldul jogi szvegeket az Eurpai Kzssgnl, vagy olyan vllalatok esetn,
amelyek ugyanazt a termket sok orszgban rtkestik. A korltozott nyelveket nha Caterpillar-angolnak
nevezik, mert a Caterpillar vllalat volt az els, amelyik az tmutatit ilyen formban prblta megrni. A
Xerox olyan nyelvet definilt a javtsi tmutatk szmra, amely annyira egyszer volt, hogy gppel le
lehetett fordtani minden olyan nyelvre, amellyel a Xerox rintkezsbe kerl. Tovbbi haszonknt az eredeti
angol nyelv tmutatk is vilgosabb vltak.
751
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
4. Irodalmi fordts (literary translation), amely a forrsszveg legkisebb rnyalatt is megrzi. Ez jelenleg
tlmutat a legmodernebb gpi fordtk kpessgn is.
A nyersfordts pldjaknt lljon itt jelen fejezetnk els bekezdsnek a SYSTRAN fordt szolgltats ltal
trtnt fordtsa elbb olaszra, majd vissza angolra:17
A fordts azrt nehz, mert ltalban a szvegek mly megrtst ignyli, amihez pedig a kzlt szituci mly
megrtse szksges. Ez mg nagyon egyszer szvegek esetn is fennll, st egyszavas szvegek esetn is.
Vegyk a Open szt egy zlet ajtajn.18 Ez azt az informcit kzvetti, hogy az zlet pillanatnyilag fogad
vevket. Most vegyk ugyanezt a szt egy jonnan felptett zleten tallhat hatalmas transzparensen. Ez azt
jelenti, hogy az zlet megnylt, de az olvask nem reznk becsapva magukat, ha jszaka a transzparens
eltvoltsa nlkl lenne zrva a bolt. A kt felirat ugyanazt a szt hasznlja klnbz jelentsek kzvettsre.
Nmet nyelv orszgban a felirat az ajtn Offen, mg a transzparensen Neu erffnet lenne. 19
Az a problma, hogy az egyes nyelvek eltr mdon kategorizljk a vilgot. Pldul a francia doux sz
jelentsek szles krt fogja t, amely megkzeltleg a kvetkez angol szavakkal adhat meg: soft, sweet,
gentle.20 Hasonlkppen az angol hard sz gyakorlatilag a nmet hart sz sszes jelentst (fizikailag
ellenll, durva) lefedi, emellett a schwierig (nehz, fradsgos, bonyolult rtelemben) sz nhny
jelentst is magban foglalja. A nmet heilen (meggygyt) ige az angol cure (gygyt) sz orvosi
hasznlatt fedi le, tovbb a heal (meggygyul) tranzitv s intranzitv jelentseit. Emiatt az adott mondat
jelentsnek brzolsa sokkal nehezebb a fordts, mint az egynyelvi megrts esetn. Egy egynyelv
elemzrendszer hasznlhatna olyan prediktumokat, mint Open(x), azonban a fordts cljbl a reprezentcis
nyelvnek esetleg tbb megklnbztetst kellene tennie, pldul az Offen jelentst reprezentl Open1(x)
prediktummal s a Neu erffnet jelentst reprezentl Open2(x) prediktummal. Azt a reprezentcis nyelvet,
amely a lefedett nyelvekhez szksges sszes megklnbztetst lehetv teszi, kztes nyelvnek (interlingua)
nevezzk.
Folykony fordtshoz az szksges, hogy a fordt (ember vagy gp) elolvassa az eredeti szveget, megrtse a
szitucit, amirl szl, s talljon egy megfelel szveget a clnyelvben, amely jl lerja ugyanazt, vagy egy
hasonl szitucit. Ez gyakran vlasztst jelent. Pldul amennyiben az angol you sz egy szemlyre
vonatkozik, akkor vagy a magyar hivatalos n vagy a kzvetlen te alakra fordthat. Egyszeren nem lehet
a you fogalomrl beszlni magyarul anlkl, hogy eldntennk, hogy hivatalos vagy kzvetlen mdon
szeretnnk hasznlni. A fordtk (mind a gpi, mind az emberi) nha nehezen tudjk ezt a dntst meghozni.
752
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
fakad nehzsgek is hozzaddnak. A megkzelts azrt trkeny, mert ha az elemzs sikertelen, akkor nincs
kimenet. Azonban az az elnye, hogy a rendszerben nincs olyan komponens, amelynek kt (termszetes) nyelvet
egyszerre kell ismernie. Ez azt jelenti, hogy kztes nyelv hasznlatval n nyelv kzti fordts O(n) s nem O(n2)
nehzsg.
Ms rendszerek az tvitelen (transfer) alapulnak. Fordtsi szablyok (vagy pldk) adatbzist tartalmazzk,
s amikor egy szably (vagy plda) illeszkedik, akkor kzvetlenl fordtanak. Az tvitel lexikai, szintaktikai
vagy szemantikai szinten trtnhet. Pldul egy szigoran szintaktikai szably az angol [Mellknv Fnv]
szekvencit a francia [Fnv Mellknv] szekvenciba kpezi le. Egy kevert szintaktikai s lexikai szably a
francia [S1 et puis S2] szekvencit az angol [S1 and then S2] szekvenciba kpezi le.21 Azt az tvitelt, amely
egy mondatot kzvetlenl egy msikba visz t, memriaalap fordtsnak (memory-based translation)
neveznk, mivel nagyszm (angol, francia) pr memorizlsra tmaszkodik. Az tviteli mdszer robusztus,
mert minden esetben generl valamilyen kimenetet, s legalbb a szavak egy rsze felttlenl helyes. A 23.5.
bra bemutatja az egyes tviteli pontokat.
23.5. bra - Egy gpi fordt rendszer vlasztsi lehetsgeit brzol sematikus
diagram. A fenn tallhat angol szveggel kezdjk. A kztes nyelven alapul rendszer a
folytonos vonalakat kveti, az angol szveget elszr szintaktikai elemzsnek veti al,
majd szemantikai s kztes nyelvi reprezentcit llt el, vgl szemantikai,
szintaktikai s lexikai formkon keresztl francia szveget llt el. Az tvitelalap
rendszerek a szaggatott vonalak ltal jellt rvidzrakat hasznljk. Az egyes
rendszerek eltr szinteken vgzik az tvitelt, egyes rendszerek tbb szinten is.
753
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
Egy angol nyelv mondat (E) pldul francia24 (F) mondatra trtn fordtsnak problmjt a Bayes-szably
kvetkez alkalmazsaknt rhatjuk le:
argmaxF P(F|E)
= argmaxF P(E|F)P(F)/P(E)
= argmaxF P(E|F)P(F)
Ez a szably azt lltja, hogy minden lehetsges F francia mondatot figyelembe kell vennnk, s azt kell
vlasztanunk, amelyik maximalizlja P(E|F)P(F)-t. A P(E) tnyezt nem kell figyelembe venni, hiszen minden
F esetn azonos. A P(F) tnyez a francia nyelvi modell (language model), azt adja meg, hogy milyen
valsznsg egy adott francia mondat. A P(E|F) a fordtsi modell (translation model), azt adja meg, hogy
milyen valsznsg egy adott angol mondat, mint az adott francia mondat fordtsa.
Az gyes olvask bizonyra csodlkoznak, hogy mit nyertnk a P(F|E) definilsval a P(E|F) segtsgvel. A
Bayes-szably ms alkalmazsainl azrt tettk ezt, mert kauzlis modellt akartunk hasznlni. Pldul a
P(Szimptmk|Betegsg) kauzlis modellt hasznltuk P(Betegsg|Szimptmk) kiszmolsra. A fordts
esetben azonban egyik irny sem kauzlisabb, mint a msik. Jelen esetben a Bayes-szably alkalmazsnak az
az oka, hogy azt hisszk, kpesek lesznk egy olyan P(F) nyelvi modellt megtanulni, amely pontosabb, mint a
P(E|F) fordtsi modell (s pontosabb, mint P(F|E) kzvetlen becslse). Lnyegben a problmt kt rszre
osztottuk: elszr a P(F|E) fordtsi modellt alkalmazzuk, hogy olyan francia mondatokat talljunk, amelyek
visszaadjk az angol mondat lnyegt, de amelyek nem felttlenl folykony francia mondatok, majd a P(F)
nyelvi modellt (amelyre sokkal jobb valsznsgi becslsnk van) hasznljuk a legjobb jellt kivlasztsra.
A P(F) nyelvi modell brmilyen olyan modell lehet, amely egy mondathoz valsznsget rendel. Nagyon nagy
korpusz esetn P(F)-et kzvetlenl becslhetnnk az egyes mondatok korpuszbeli elfordulsi szma alapjn.
Pldul ha a webrl sszegyjtnk 100 milli francia mondatot, s a Clique ici 25 mondat 50 ezerszer fordul
el, akkor P(Clique ici) = 0,0005. Azonban mg 100 milli plda esetn is a legtbb mondat elfordulsi szma
nulla lenne.26 Emiatt az ismert bigram modellt fogjuk alkalmazni, amelyben az f1fn szavakbl ll francia
nyelv mondat valsznsge:
Ismernnk kell az olyan bigram valsznsgeket, mint pldul a P(Eiffel|tour) = 0,02.27 Ez a szintaxis
mindssze nagyon loklis jellemzit kpes lerni, ahol a sz csak az t megelz sztl fgg. A
nyersfordtshoz azonban tbbnyire ez is elegend.28
A P(E|F) fordtsi modellt (translation model) nehezebb meghatrozni. Egyrszt nem ll rendelkezsnkre
(angol, francia) mondatprokbl ll ksz gyjtemny, amely alapjn tanthatnnk. Msrszt a modell
komplexitsa nagyobb, mivel mondatok keresztszorzatra, s nem pedig klnll mondatokra alapul. Egy
tlzottan leegyszerstett fordtsi modellel fogunk kezdeni, s felptnk valamit, ami az IBM Model 3-at
(Brown s trsai, 1993) kzelti, ami tovbbra is a vgletekig leegyszerstettnek tnik, azonban az esetek
krlbell felben elfogadhat fordtsokat generlt.
A vgletekig leegyszerstett modell arrl szl, hogy a mondat fordtshoz egyszeren fordtsuk le a szavakat
egyesvel s egymstl fggetlenl, balrl jobbra. Ez egy unigram szvlasztsi modell. Lehetv teszi, hogy
egyszeren kiszmtsuk egy fordts valsznsgt:
754
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
Brmely elfogadhat valsznsgi rtkhalmaz esetn a the dog29 lenne a le chien maximum-likelihood
becslje. A legtbb esetben azonban a modell megbukik. Az egyik problma a szrend. Franciban a dog
megfelelje a chien, a brown- a brun, azonban a brown dog- a chien brun.30 A msik problma az,
hogy a szvlaszts nem egy az egyes lekpezs. Az angol home szt gyakran la maison-nak31 fordtjk,
ami egy hrmas lekpezs (illetve hrom az egybe a msik irnyban). Ezen problmk ellenre az IBM Model 3
makacsul ragaszkodik az alap unigram modellhez, br, hogy javtson rajta, hozztesz nhny kiegsztst.
A modell, hogy kpes legyen kezelni azt a tnyt, hogy a szavakat nem egy az egyben fordtjuk, bevezeti a sz
termkenysgnek (fertility) fogalmt. Egy n termkenysg szt n-szer lemsolja, s az n msolat mindegyike
fggetlenl fordtdik. A modell az sszes francia szra tartalmazza a P(termkenysg = n|sz) paramtereket.
Az la maison home-ra trtn fordtshoz a modell 0 termkenysget vlasztana az s la
szavakra,32 mg egyet a maison-ra, s utna az unigram modellt alkalmazn a maison sz home-ra trtn
fordtshoz. Ez elgg indokoltnak tnik, az s a la kis informcitartalm szavak, amelyeket sszer
res karakterfzrr fordtani. A msik irnyba trtn fordts mr ktsgesebb. A home szhoz hrmas
termkenysget rendelne a modell, home home home szekvencit kapva. Az els home -ra, a msodik
la-ra, mg a harmadik maison-ra fordulna. A fordtsi modell szempontjbl az la maison s a maison
la pontosan azonos valsznsget kapna. (Pont ez a ktsges rsz.) A nyelvi modellre lenne bzva, hogy
eldntse, melyik a jobb. rtelmesebbnek tnhet a home-ot kzvetlenl la maison-ra fordtani, mint
kzvetett mdon a home home home-on keresztl, azonban ehhez sokkal tbb paramterre lenne szksg,
amelyeket nehz lenne a rendelkezsre ll korpuszbl meghatrozni.
A fordtsi modell vgs rsze a szavak megfelel sorrendbe trtn permutlsa. Ez egy eltolsi modellel
trtnik, amely sorn a sz az eredeti pozcijbl a vgleges pozciba mozog. Pldul a chien brun brown
dog-ra trtn fordtsa sorn a brown sz +1 eltolsi rtket kap (azaz jobbra egy pozcit mozog), mg a
dog 1 rtket. Az olvas elkpzelheti, hogy az eltolsnak fggnie kellene a sztl: az olyan mellknevek,
mint a brown tbbnyire pozitv eltolsi rtkkel rendelkeznnek, mert a francia nyelv ltalban a fnv utn
helyezi el a mellkneveket. Azonban az IBM Model 3 gy dnttt, hogy a sztl fgg eltols tl sok
paramtert ignyelne, ezrt az eltols fggetlen a sztl, s csak a mondatbeli pozcitl s a mondat mindkt
nyelvbeli hossztl fgg. Azaz a modell a kvetkez paramtereket becsli:
P(Eltols = o|Pozci = p, AngolHossz = m, FranciaHossz = n)
Most mr tudjuk, hogyan kell kiszmtani a P(F|E) valsznsget brmely (francia, angol) mondatprra.
Azonban amit igazbl tenni akarunk az az, hogy egy adott angol mondat esetn megtalljuk azt a francia
mondatot, amely maximalizlja ezt a valsznsget. Nem sorolhatunk fel egyszeren mondatokat: 10 5 francia
sz esetn 105n n hosszsg mondat lehetsges, s szmos sszerendels mindegyikre. Mg ha csak a 10
leggyakoribb sz-sz fordtst tekintjk minden egyes szra, s csak 0 s 1 eltolst vesznk figyelembe, akkor
a kutya (A ford.)
barna kutya (A ford.)
31
home otthon, la maison otthon lenni, haza menni rtelemben (A ford.)
32
nagyjbl a magyar -ban, -ben, -ba, -be ragoknak felel meg, la nnem hatrozott nvel (A ford.)
33
A barna kutya nem ment haza. (A ford.)
29
30
755
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
is 2n/210n mondatot kapunk, ami azt jelenti, hogy n = 5 esetn mg fel tudnnk ket sorolni, de n = 10 esetn
mr nem. Ehelyett meg kell keresnnk a legjobb megoldst. Az A* keress hatkonynak bizonyult a feladatra
(Germann s trsai, 2001).
Ennek a modellnek mg egy 1000 szt tartalmaz, szerny szkincs esetn is paramterek milliira van
szksge. Nyilvnvalan adatokbl kell megtanulnunk ket. Felttelezzk, hogy az egyetlen rendelkezsnkre
ll adat egy ktnyelv korpusz. Lssuk a felhasznlsi mdjt:
Mondatokra trtn szegmentci: a fordtsi egysg a mondat, teht a korpuszt mondatokra kell trdelnnk.
A pont a mondatvg jellemz indiktora, de vegyk a Dr. J. R. Smith of Rodeo Dr. megrkezett. pldt,
amelyben csak az utols pont jelenti a mondat vgt. A mondatokra trtn szegmentcit krlbell 98%-os
pontossggal lehet elvgezni.
A P(szi|szi1) francia nyelvi modell becslse: vegyk a korpusz francia nyelv rszt, szmoljuk meg a
szprok elfordulsi gyakorisgt, s vgezznk simtst, hogy megkapjuk a P(szi|szi1) becsljt. Pldul
megkaphatjuk, hogy P(Eiffel|tour) = 0,02.
Mondatok illesztse: minden egyes angol nyelv mondatra hatrozzuk meg az(oka)t a francia nyelv
mondato(ka)t, amely(ek) megfelel(nek) neki a francia vltozatban. ltalban a szvegben kvetkez angol
mondat megfelel a kvetkez francia mondatnak 1:1 megfeleltetssel, azonban nha elfordulnak varicik: az
egyik nyelv mondatot 2:1 megfeleltetsbe vgjuk, vagy kt mondat sorrendjt felcserljk, 2:2 megfeleltetst
kapva. Mindssze a mondathosszakat tekintve lehetsges az illesztsk (1:1, 1:2, 2:2 stb.) 90% s 99% kztti
pontossggal, a Viterbi szegmentcis algoritmus (lsd 23.1. bra) megfelel varicijval. Mg jobb
illeszkeds is elrhet amennyiben olyan irnypontokat hasznlunk, amelyek mindkt nyelvben kzsek, mint
pldul szmok, tulajdonnevek, illetve olyan szavak, melyeknek egy ktnyelv sztr alapjn tudjuk, hogy
egyrtelm a fordtsuk.
A P(Termkenysg = n|szF) kezdeti termkenysgi modell becslse: legyen adott egy m hosszsg francia
mondat, amely egy n hosszsg angol mondathoz illeszkedik, ekkor vegyk ezt annak altmasztsaknt, hogy
mindegyik (a mondatban elfordul) francia sz termkenysge n/m. Vegyk figyelembe ezeket az sszes
mondatra az egyes szavak termkenysgi eloszlsnak meghatrozshoz.
A P(szE|szF) kezdeti szvlasztsi modell becslse: vegyk az sszes olyan mondatot, amely tartalmazza
pldul a brun szt. Azok a szavak, amelyek a leggyakrabban fordulnak el az illeszked angol mondatokban,
valsznleg a brun sz-sz fordtsai.
A P(Eltols = o|pozci, hosszE, hosszF) kezdeti eltolsi modell becslse: most, hogy rendelkeznk egy
szvlasztsi modellel, hasznljuk fel azt az eltolsi modell becslsre. Egy n hosszsg angol mondat esetn,
amely egy m hosszsg francia mondathoz illeszkedik, vegyk minden egyes francia szt (i pozciban) s
minden olyan angol szt (j pozciban), amely valszn vlaszts lenne a francia szra, s vegyk ezt P(Eltols
= i j|i, n, m) bizonytkul.
A becslsek javtsa: hasznljuk az EM (elvrsmaximalizl) algoritmust a becslsek javtsra. A rejtett
vltoz az illeszked mondatprok kzti szilleszkedsi vektor (word alignment vector). A vektor megadja
minden egyes angol szra a megfelel francia sz francia mondatbeli pozcijt. Pldul megkaphatjuk a
kvetkezt:
756
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
Elszr a paramterek aktulis becslit hasznlva elksztjk a szilleszkedsi vektort mindegyik mondatprra.
Ez jobb becsl megalkotst fogja szmunkra lehetv tenni. A termkenysgi modellt az alapjn becsljk,
hogy a szilleszkedsi vektor egy adott tagja hnyszor kpzdik le tbb szra, vagy egyetlenegyre sem. A
szvlasztsi modellnek a mondat sszes szava helyett most mr csak olyan szavakat kell figyelembe vennie,
amelyek egymshoz lettek illesztve. Az eltolsi modell a mondat egyes pozciinak elmozdulst vizsglja a
szilleszkedsi vektornak megfelelen. Sajnos nem tudjuk, hogy mi a helyes illeszkeds, s tl sok van bellk
ahhoz, hogy mindet felsoroljuk. Emiatt arra vagyunk knyszertve, hogy megkeressnk nhny nagy
valsznsg illeszkedst, s a valsznsgkkel slyozzuk ket, mikzben bizonytkot gyjtnk az j
paramterbecslkhz. Mindssze ennyire van szksgnk az EM algoritmushoz. A kezdeti paramterek alapjn
illeszkedseket szmolunk, majd az illeszkedsek alapjn javtjuk a paramterbecslket. Ismteljk, amg
konvergl.
5. sszefoglals
A fejezet fbb pontjai a kvetkezk:
Az n-gram alap valsznsgi nyelvi modellek meglep mennyisg informcit kpesek visszaadni egy
nyelvrl.
A CFG-ket ki lehet egszteni valsznsgi CFG-kre, knnyebb tve az adatok alapjn trtn tanulsukat
s a ktrtelmsgek feloldst.
Az informcikeres (information retrieval) rendszerek egy nagyon egyszer, szzskokra pl nyelvi
modellt hasznlnak, ennek ellenre j felidzsi (recall) s pontossgi (precision) mutatkkal rendelkeznek
nagyon nagy korpuszokon.
Az informcikinyer (information extraction) rendszerek bonyolultabb modellt alkalmaznak, amely
korltozottan figyelembe veszi a szintaxist s a szemantikt. Gyakran vges automatk kaszkdjval
valstjk meg ket.
A gpi fordt (machine translation) rendszereket klnbz technikk alkalmazsval valstottk meg, a
teljes szintaktikai s szemantikai analzistl kezdve egszen a szgyakorisgon alapul statisztikai
mdszerekig.
Egy statisztikai nyelvi rendszer ptse sorn az a legjobb, ha olyan rendszert gondolunk ki, amely a
rendelkezsre ll adatokat jl hasznostja, mg akkor is, ha a modell a vgletekig leegyszerstettnek tnik.
757
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
Az egyszer n-gram bet- s szmodellek nem az egyetlen lehetsges valsznsgi modellek. Blei s trsai
lerjk a rejtett Dirichlet-allokcinak (latent Dirichlet allocation) nevezett valsznsgi szvegmodellt,
amely a szvegeket tmk keverknek tekinti, amelyben mindegyik tma sajt szeloszlssal rendelkezik (Blei
s trsai, 2001). Ez a modell a rejtett szemantikai indexels (latent semantic indexing) modell (Deerwester s
trsai, 1990) (lsd mg (Papadimitriou s trsai, 1998)) kibvtsnek s racionalizlsnak tekinthet, valamint
Sahami s trsai tbbszrs okkeverk (cause mixture) modelljhez is ktdik (Sahami s trsai, 1996).
A valsznsgi krnyezetfggetlen nyelvtanok (PCFG) megvlaszoljk Chomsky valsznsgi modellekkel
kapcsolatos sszes ellenvetst, s a CFG-khez kpest elnykkel rendelkeznek. A PCFG-ket Booth (Booth,
1969) s Salomaa (Salomaa, 1969) vizsgltk. Jelinek bemutatja a veremdekdol algoritmust, amely a Viterbikeress olyan varicija, amely arra hasznlhat, hogy megtallja egy PCFG-vel a legvalsznbb elemzst
(Jelinek, 1969). Baker vezette be a belskls algoritmust (Baker, 1979), Lari s Young lerta hasznlhatsgt
s korltait (Lari s Young, 1990). Charniak (Charniak, 1996), valamint Klein s Manning (Klein s Manning,
2001) a treebank nyelvtanokkal trtn elemzst trgyaljk. Stolcke s Omohundro megmutattk, hogyan lehet
nyelvtani szablyokat tanulni Bayes-modellek egyestsvel (Stolcke s Omohundro, 1994). Tovbbi PCFGalgoritmusokat mutatott be Charniak (Charniak, 1993), valamint Manning s Schtze (Manning s Schtze,
1999). Collins a terlet ttekint tanulmnyt knlja, tovbb az egyik legsikeresebb statisztikai
elemzprogram magyarzatt (Collins, 1999).
Sajnos a PCFG-k rosszabbul teljestenek, mint az egyszer n-gram modellek szmos feladat esetn, mert a
PCFG-k nem kpesek reprezentlni az egyes szavakhoz trsul informcikat. Hogy kijavtsk ezt a
hinyossgot, szmos szerz (Collins, 1996; Charniak, 1997; Hwa, 1998) bevezettk a szkinccsel elltott
valsznsgi nyelvtanok (lexicalized probabilistic grammar) klnbz verziit, amelyek kombinljk a
krnyezetfggetlen s a szalap statisztikkat.
A Brown-korpusz volt az els prblkozs, hogy tapasztalati nyelvszeti clokra kiegyenslyozott korpuszt
gyjtsn (Francis s Kucera, 1967). Krlbell egymilli szt tartalmazott, szfaji informcival elltva.
Eredetileg 100 ezer lyukkrtyn troltk. A Penn treebank krlbell 1,6 milli sz gyjtemnye, kzi
elemzssel fkba rendezve. Elfr egy CD-n. A brit nemzeti korpusz (British National Corpus) kibvti ezt 100
milli szra (Leech s trsai, 2001). A vilghl tbb mint egybilli szt tartalmaz, tbb mint 10 milli
szerveren troldik.
Az informcikeress (informational retrieval) terlete irnti rdeklds jra n, amelyet az internetes
keress szles kr elterjedse inspirl. Robertson egy korai ttekintst ad, s bevezeti a valsznsgi
rangsorolsi elvet (Robertson, 1977). Manning s Schtze az NLP statisztikai megkzeltsnek kontextusban
trgyalja rviden az IR-t (Manning s Schtze, 1999). Baeza-Yates s Ribeiro-Neto ltalnos cl ttekintst ad
(Baeza-Yates s Ribeiro-Neto, 1999), helyettestve az olyan rgi klasszikusokat, mint Salton s McGill (Salton
s McGill, 1983), valamint Frakes s Baeza-Yates (Frakes s Baeza-Yates, 1992). A Gigabjtok kezelse
(Managing Gigabytes) c. knyv pont azt teszi, amit a cme mond: elmagyarzza hogyan lehet hatkonyan
indexelni, tmrteni s lekrdezni gigabjtos mret korpuszokat (Witten s trsai, 1999). Az amerikai
kormny Nemzeti Szabvnygyi s Technolgiai Intzete (National Institute of Standards and Technology,
NIST) ltal szervezett TREC konferencia minden vben megrendezi az IR-rendszerek versenyt, s
kiadvnyban publiklja az eredmnyeket. A verseny els ht vben a rszt vev rendszerek teljestmnye
krlbell megduplzdott.
A legnpszerbb IR-modell a vektortr modell (vector space model) (Salton s trsai, 1975). Salton munkja
uralta a terlet korai veit. Kt alternatv valsznsgi modell ltezik. Mi a Ponte s Croft munkjn alapult
mutattuk be (Ponte s Croft, 1998). A P(D, Q) kzs valsznsgi eloszlst P(Q|D) segtsgvel modellezi.
Egy alternatv modell (Maron s Kuhns, 1960; Robertson s Sparck Jones, 1976) a P(D|Q)-t hasznlja. Lafferty
s Zhai megmutatta, hogy a modellek ugyanazon a kzs valsznsgi eloszlson alapulnak, azonban a
modellvlasztsnak kvetkezmnyei vannak a paramtertantsra (Lafferty s Zhai, 2001). Az ltalunk
bemutatottak az munkjukon alapul. Turtle s Croft sszehasonltjk a klnfle IR-modelleket (Turtle s
Croft, 1992).
Brin s Page lerjk egy vilghln keres gp implementcijt, taglalva a PAGERANK algoritmust is, mely a
dokumentumok minsgnek weblinkek elemzsn alapul lekrdezsfggetlen mrtke (Brin s Page, 1998).
Kleinberg lerja, hogyan lehet hiteles forrsokat tallni a weben hivatkozselemzssel (Kleinberg, 1999).
Silverstein s trsai megvizsgltak egy egymillird webkeresst tartalmaz logot (Silverstein s trsai, 1998).
Kukich felmrte a helyesrsi hibk javtsnak irodalmt (Kukich, 1992). Porter lerja a klasszikus szablyalap
sztvest algoritmust (Porter, 1980), mg Krovetz egy sztralap verzit r le (Krovetz, 1993).
758
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
5.2. Feladatok
23.1.
759
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
(Jurafsky s Martin, 2000) alapjn. Ebben a feladatban szerzsget osztlyoz rendszert fogunk kifejleszteni,
amely egy adott szveg esetn megprblja meghatrozni, hogy a kt plyz szerz kzl melyik rta a
szveget. Szerezznk be szvegeket kt klnbz szerztl. Vlasszuk szt ket tant s teszthalmazokra.
Tantsunk unigram modellt mindkt szerz tant halmaza alapjn. Vgl minden egyes tesztel szvegre
szmtsuk ki mindkt unigram modellre a valsznsget, s rendeljk a legvalsznbb modellhez. Hatrozza
meg a technika pontossgt. Tudn nvelni a pontossgot tovbbi jellemzkkel? A nyelvszet ezen rszterlett
a stlusmrs tudomnynak (stylometry) nevezzk, sikerei kz sorolhat a Federalist Papers (Mosteller s
Wallace, 1964), valamint Shakespeare nhny vitatott munkja (Foster, 1989) szerzjnek meghatrozsa.
23.2.
Ez a feladat az n-gram modellek minsgt mri fel. Keressen vagy hozzon ltre krlbell 100 ezer szavas
egynyelv korpuszt. Trdelje szavakra, s szmtsa ki az egyes szavak elfordulsi gyakorisgt. Hny
klnbz sz tallhat benne? brzolja a gyakorisgot a sorrend (leggyakoribb, msodik leggyakoribb stb.)
fggvnyben loglog skln. Hatrozza meg a bigramok (kt egymst kbvet sz) s trigramok (hrom
egymst kvet sz) gyakorisgt is. Hasznlja ezeket a gyakorisgokat nyelv generlsra: az unigram, bigram
s trigram modell alapjn a gyakorisgnak megfelel vletlen vlasztssal generljon 100 szavas szvegeket.
Hasonltsa ssze ezeket a szvegeket a tnylegesen beszlt nyelvvel. Vgl szmolja ki az egyes modellek
sszetettsgt.
23.3.
Ez a feladat a spam-felismerssel foglalkozik. A spam defincija kretlen tmeges reklm e-mail. A spam
kezelse bosszant elfoglaltsg szmos e-mailez szmra, teht megbzhat eltvoltsuk lds lenne. Hozzon
ltre spam s spam-mentes e-mailekbl ll korpuszt. Elemezze mindkt korpuszt, s llaptsa meg, hogy mely
jellemzk lennnek alkalmasok az osztlyozsra (unigram, brigram, zenethossz, felad, rkezsi id). Ezutn
tantson egy osztlyoz algoritmust (dntsi fa, naiv Bayes vagy ms, n ltal vlasztott algoritmus) egy tant
halmazon, majd rtkelje pontossgt egy teszthalmazon.
23.4.
Ksztsen t lekrdezsbl ll teszthalmazt, majd kldje el hrom nagy webkeresnek. rtkelje mindegyik
pontossgt az els 1, 3 s 10 dokumentumra s az tlagos reciprok rangra. Prblja megmagyarzni az
eltrseket.
23.5.
Prbljon megbizonyosodni arrl, hogy az elbbi feladat keresgpei kzl melyek hasznlnak betkonverzit,
sztvestst, szinonimkat s helyesrsihiba-javtst.
23.6.
Becslje meg, hogy mekkora trterlet szksges egy egymillird weboldalt tartalmaz korpusz indexelshez.
Mutassa be a felttelezseket, amelyekre alapozott.
23.7.
rjon egy regulris kifejezst vagy egy rvid programot vllalatnevek kinyersre. Tesztelje zleti hreket
tartalmaz cikkeken. Adja meg az elrt felidzst s pontossgot.
23.8.
Vlasszon ki t mondatot s kldje el egy internetes fordtszolgltatsnak. Fordtsa le angolrl egy idegen
nyelvre, majd vissza angolra. rtkelje a kapott mondatokat nyelvtani helyessg s a jelents megtartsnak
szempontjbl. Ismtelje meg a folyamatot; az iterci msodik lpse rosszabb vagy azonos eredmnyeket ad?
Befolysolja az eredmny minsgt a kzbens nyelv megvlasztsa?
23.9.
Gyjtsn ssze idre vonatkoz kifejezseket, pldul kt rakor, jflkor, 12:46-kor. Talljon ki olyan
nyelvtanilag helytelen pldkat is, mint huszont rakor vagy flnegyedhromkor. rjon nyelvtant az id
nyelvre.
760
Created by XMLmind XSL-FO Converter.
Valsznsgi nyelv-feldolgozs
23.10.
(Knight, 1999) alapjn. Az IBM Model 3 gpi fordt felttelezi, hogy miutn a szvlasztsi modell egy
szlistt ajnl, a nyelvi modell kpes kivlasztani a legjobb permutcit. Ez a feladat megvizsglja, hogy
mennyire rtelmes ez a felttelezs. Prblja meghatrozni a kvetkez mondatok szavainak helyes sorrendjt:
a. have programming a seen never I language better
b. loves john mary
c. is the communication exchange of intentional information brought by about the production perception of and
signs from drawn a of system signs conventional shared
Melyik mondat szavait tudta sorrendbe tenni? Milyen tuds alapjn volt erre kpes? Tantson egy bigram
modellt egy tant korpusz alapjn, s hasznlja arra, hogy meghatrozza egy tesztkorpusz mondatainak
legnagyobb valsznsg permutciit. Mutassa meg a modell pontossgt.
23.11.
Amennyiben megnz egy angolfrancia sztrt, a hear ige fordtsa entendre.34 Azonban ha az IBM Model
3-at a kanadai Hansard alapjn tantjuk, akkor a hear legvalsznbb fordtsa Bravo. Magyarzza meg,
hogy mi ennek az oka, s becslje meg, hogy mi lehet a hear termkenysgi eloszlsa. (Segtsg: ha Hansardszvegeket szeretne megnzni, rja be egy webkeresbe a [Hansard hear] lekrdezst.)
34
761
Created by XMLmind XSL-FO Converter.
1. Bevezets
Egy mestersges gens tbb szlelsi modalitssal is rendelkezhet. Amin az gensek s az emberek is osztoznak,
az tbbek kztt a lts, a halls s a tapints. A hallssal a beszdfelismers tmn bell, a 15.6. alfejezetben
foglalkozunk. A tapints, mskppen a taktilis rzkels (tactile sensing) a 25. fejezet tmja, ahol a kzi
mveleteket vgz genseknl vizsgljuk meg ennek a hasznlatt, a fejezet htralev rsze pedig a ltssal
foglalkozik. Egyes robotok aktv rzkelst (active sensing) vgeznek, azaz kikldenek egy jelet, mint pldul
radar- vagy ultrahangjelet, s ennek a jelnek a krnyezetbl rkez visszaverdst vizsgljk.
Egy gens ktfle mdon hasznlhatja az rzkelseit. A tulajdonsg kinyersi (feature extraction)
megkzelts szerint az gens nhny kevs szm tulajdonsgot szlel az rzkel bemenetein, s ezeket
tovbbtja az gensprogramnak, amely a tulajdonsgoknak megfelelen reagl, vagy kombinlja ket ms
informcikkal. A wumpus gens ily mdon mkdtt, t rzkelvel, amelyek mindegyike egybites
informcit nyert ki. Ma mr ismert, hogy egy lgy az optikai bemenetrl tulajdonsgokat nyer ki, s ezeket
direkt mdon a kanyarodsban segt izmokhoz tovbbtja, lehetv tve, hogy 30 milliszekundumon bell
reagljon, s irnyt vltson.
Az alternatv lehetsg a modellalap (model-based) megkzelts, ahol a szenzoros bemenet alapjn a vilg
egy modellje pl fel. E megkzelts szerint egy f fggvnybl indulunk ki, amely a vilg W llapott az ltala
keltett S ingerletre kpezi le:
S = f (W)
Az f fggvnyt a fizika s az optika hatrozza meg, s viszonylag jl ismerjk. S s egy vals vagy elkpzelt W
vilg ellltsa f-bl a szmtgpes grafika (computer graphics) ltal kezelt problma. A szmtgpes lts
bizonyos rtelemben a szmtgpes grafika fordtottja, ha adott f s S, akkor W-t prbljuk kiszmtani:
W = f
(S)
Sajnos az f-nek nincs jl definilt inverze. Nem lthatunk a sarkon tlra, gy a vilg aktulis llapotnak minden
aspektust az ingerletbl visszalltani nem tudjuk. St az a rsze, amit lthatunk, nagyban bizonytalan:
kiegszt informci nlkl nem tudjuk megmondani, hogy S egy jtk Godzilla-kpe, amint egy hatvan
centimteres modellpletet tarol le, vagy egy valsgos szrnyeteg, amely egy hatvanmteres pletet pusztt
el. Ezen problmk egy rszt kezelhetjk gy, hogy egy vilg megtallsa helyett vilgok valsznsgi
eloszlst hatrozzuk meg:
P(W) = P(W|S)P(S)
Az ilyen modellezs legfontosabb htrnya az, hogy tl nehz problmt ksrel meg megoldani. Gondoljunk
bele, hogy a szmtgpes grafikban tbbrnyi szmtsra lehet szksg egy film egyetlen kockjnak az
ellltshoz, amibl 24 kocka kell msodpercenknt, s f 1 kiszmtsa sokkal bonyolultabb, mint f-. Vilgos,
hogy ez tl sok szmts egy szuperszmtgp szmra, hogy vals idben reagljon, nem is beszlve egy
lgyrl. Szerencsre az gensnek nem kell a fnykph szmtgpes grafikhoz hasonl szint modellel
rendelkeznie a vilgrl. Az gensnek elegend azt tudnia, hogy rejtzkdik-e egy tigris a boztban, s nem kell
tudnia a tigris htn lev minden egyes szrszl pontos elhelyezkedst s irnyt.
A fejezet nagy rszben azt fogjuk ltni, hogy hogyan kell objektumokat pldul tigriseket felismerni,
tovbb olyan mdszereket, amelyek ezt a tigris minden egyes rszletnek reprezentlsa nlkl teszik. A 24.2.
alfejezetben a kpalakts folyamatt tanulmnyozzuk majd, definilva az f(W) fggvny egyes aspektusait.
762
Created by XMLmind XSL-FO Converter.
Az szlels
Elszr a folyamat geometrijra tekintnk. Ltni fogjuk, hogy a fny a vilg objektumairl az gens
rzkeljnek kpskjn lv pontokra verdik vissza. Ez a geometria magyarzza meg, hogy egy nagy Godzilla
a tvolban mirt nz ki gy, mint egy kis Godzilla a kzelben. Ezutn a folyamat fotometrijt vizsgljuk, amely
lerja, hogy a tj fnye hogyan hatrozza meg a kp pontjainak fnyessgt. A geometria s a fotometria egytt
egy olyan modellt nyjtanak, amely lerja, hogy a vilg objektumai hogyan kpzdnek le a kppontok
ktdimenzis tmbjre.
Annak megrtse utn, hogy hogyan jnnek ltre a kpek, megvizsgljuk, hogy hogyan dolgozzuk fel ket. A
vizulis feldolgozs folyamata az emberekben s a szmtgpekben is hrom rszre bonthat. Elszr, avagy
az alacsony szint lts sorn (24.3. alfejezet), a feldolgozatlan kpet simtjuk, hogy kiszrjk a zajt, majd a
ktdimenzis kp tulajdonsgait kinyerjk, elssorban a kp rgii kztti leket. A kzps szint ltsban
ezeket sszekapcsolva rgikat hozunk ltre. A magas szint ltsban (24.4. alfejezet) a ktdimenzis rgikat
mint a vilg valsgos objektumait ismerjk fel (24.5. alfejezet). A kpekben megtallhat olyan specilis
informcikat tanulmnyozunk, amelyeket erre a clra felhasznlhatunk, mint pldul a mozgst, a trbeli
informcit,a textrt, az rnyalst s a kontrokat. Az objektumfelismers fontos a vadonban lev gens
szmra, hogy szlelje a tigriseket, s fontos az ipari robotok szmra, hogy megklnbztesse az anykat a
csavaroktl. Vgezetl a 24.6. alfejezet megmutatja, hogy az objektumok felismerse hogyan segthet neknk
olyan hasznos feladatokban, mint pldul a manipulls vagy a navigci. A manipulls azt jelenti, hogy
megragadhatunk s hasznlhatunk szerszmokat, illetve ms trgyakat, a navigci pedig azt, hogy egyik
helyrl tmehetnk egy msikra anlkl, hogy nekimennnk valaminek. Ezeket a feladatokat szben tartva
biztosthatjuk, hogy egy gens csak akkora modellt ptsen, amire cljai elrshez szksge van.
2. Kpalkots
A lts egy jelenet (scene) objektumairl szrd fnyt sszegyjti, majd egy ktdimenzis kpet (image) alkot
egy kpskon. A kpskot fnyrzkeny anyag bortja: a retinban rodopszinmolekulk, a negatv filmen ezsthalogenidek, a digitlis fnykpezgpben pedig egy tltscsatolt eszkz (CCD) lapka. A CCD minden cellja
szszegyjti a fnyelnyels ltal adott id alatt keltett elektronokat. A digitlis fnykpezgpben a kpsk egy
nhny milli kppontbl (pixel) ll ngyzethlra van felosztva. A szem hasonl kppontrccsal rendelkezik,
amely krlbell 100 milli plcikt s 5 milli csapot tartalmaz egy hexagonlis mozaikba rendezve.
A jelenet nagyon nagy, s a kpsk egszen kicsi, teht lennie kell valamilyen mdszernek a fny kpskra
fkuszlshoz. Ezt megtehetjk lencsvel vagy anlkl. Brhogy is tesszk, a lnyeg a geometria
meghatrozsa, hogy megmondhassuk, a jelenet melyik pontja hova kerl a kpskon.
763
Created by XMLmind XSL-FO Converter.
Az szlels
A kpalkots legegyszerbb eszkze a sttkamra, amely egy doboz elejn tallhat kis lyukbl (O) s a doboz
hts rszn lev kpskbl ll (lsd 24.1. bra). Egy hromdimenzis koordinta-rendszert fogunk hasznlni,
amelynek az origja az O pont, a jelenet egy P pontjt pedig az (X, Y, Z) koordintkkal reprezentljuk. A P
pontot egy P' pontra kpezzk le a kpskon, amelynek koordinti (X, Y, Z). Ha f az O pontszer lyuknak a
kpsktl vett tvolsga, akkor a hasonl hromszgek alapjn az albbi egyenleteket tudjuk levezetni:
Ezek az egyenletek egy perspektivikus vetts (perspective projection) nven ismert kpalkotsi eljrst
definilnak. Vegyk szre, hogy a Z az osztban azt jelenti, hogy minl tvolabb van az objektum, annl kisebb
lesz a kpe. Valamint azt is figyeljk meg, hogy a kp, mind a baljobb, mind a felle irnyban fordtott a
jelenethez kpest, amit az egyenletekben a negatv eljel jelez.
A perspektivikus vettsben a prhuzamos vonalak a horizontvonalon lv pontban futnak ssze. Nzzk meg,
mirt szksgszer ez! Az (X0, Y0, Z0) ponton keresztl (U, V, W) irnyban thalad egyenes lerhat, mint az (X0
+ U, Y0 + V, Z0 + W) pontok halmaza, ahol a + s kztt vltozik. Ezen egyenes egy P pontjnak
kpskra vett vetlett az:
adja. Amint vagy ez a pont a p = (fU/W, fV/W) lesz, ha W 0. A p pontot az (U, V, W) irny
egyenesek csaldjval kapcsolatos tvlatpontnak (vanishing point) nevezzk. Az azonos irny egyenesek
tvlatpontja azonos.
Ha a trgy a kamrtl vett tvolsghoz kpest viszonylag lapos, a perspektivikus vettst a sklzott
ortografikus vettssel (scaled orthographic projection) kzelthetjk. Ennek elve a kvetkez. Ha a trgy
pontjainak Z mlysge egy bizonyos Z0 Z tartomnyban vltozik, s Z = Z0, akkor a perspektva f/Z skla
tnyezjt az s = f/Z0 llandval lehet kzelteni. Az (X, Y, Z) jelenet koordintkbl a kpskra trtn vetts
egyenletei az x = sX s az y = sY lesznek. Jegyezzk meg, hogy a sklzott fggleges sk vetts egy kzelts,
amely a jelenet azon rszeire rvnyes, amelyeknek a sajt mlysgvltozsuk elenysz. A globlis
tulajdonsgok tanulmnyozsra ezt a mdszert nem szabad hasznlni. Hogy az vatossg nem rt, erre egy
plda: fggleges sk vettsben a prhuzamos vonalak prhuzamosak maradnak ahelyett, hogy egy
tvlatpontban sszefutnnak.
2.2. Lencserendszerek
A gerincesek szeme s a modern kamerk is lencsket hasznlnak. A lencse a sttkamra nylsnl nagyobb,
gy tbb fnyt enged t. Ennek az az ra, hogy egyidejleg a jelenet minden rsznek az lessgt nem lehet
biztostani. A jelenet egy Z tvolsgban lv pontjnak a kpe a lencstl egy rgztett Z' tvolsgban
keletkezik, s a Z s a Z' kztt az:
relci ll fenn, ahol f a lencse fkusztvolsga. Ha a lencse optikai kzppontja s a kpsk kztti tvolsgot
valamilyen Z'0-nak vlasztjuk, a jelenet azon trgyai, amelyek a Z0 krl egy adott mlysgtartomnyban
fekszenek, ahol Z0 a megfelel trgytvolsg, nagyjbl lesen fognak ltszani. A jelenet ezen mlysgi
tartomnyt mlysglessgnek (depth of field) nevezzk.
Jegyezzk meg, hogy mivel a Z trgytvolsg ltalban sokkal nagyobb, mint a Z' kptvolsg vagy mint az f,
sokszor jogos az albbi kzelts:
Azaz a kptvolsg Z' f. A sttkamra vettsegyenleteit teht egy lencse ltal ltrehozott kp geometrijnak
lershoz is hasznlhatjuk.
764
Created by XMLmind XSL-FO Converter.
Az szlels
Ahhoz, hogy a klnbz Z tvolsgban lv trgyakat lesen lssuk, az emberi szem lencsje (lsd 24.2. bra)
vltoztatja az alakjt, a kamera lencsje pedig Z irnyban elmozdul.
24.3. bra - (a) Egy asztalon lv tzgp fnykpe. (b) Az (a) egy 12 12 kppontbl
ll, nagytott rszlete. (c) A rszletnek megfelel kpfnyessgrtkek egy 0-tl 255-ig
tart skln.
765
Created by XMLmind XSL-FO Converter.
Az szlels
A kp egy kppontjnak a fnyessge arnyos a jelenet kppontba vettett felleteleme ltal a kamera fel
irnytott fny mennyisgvel. Ez viszont fgg a felletelem fnyvisszaver tulajdonsgaitl s a fnyforrsok
elhelyezstl, valamint eloszlstl a jelenetben. Egy kppont fnyessgbe a jelenet egyb rszeinek
fnyvisszaver tulajdonsgai is beleszlnak, hiszen a jelenet ms felletei indirekt fnyforrsknt szolglnak,
mivel a rjuk es fnyt az adott felletelem fel verik vissza.
Ktfle visszaverdst modellezhetnk. A tkrz visszaverds (specular reflection) azt jelenti, hogy a fny
a trgy kls felletrl verdik vissza, s teljesti azt a knyszert, miszerint a beess s a visszaverds szge
megegyezik. Ilyen a tkletes tkr viselkedse. A diffz visszaverds (diffuse reflection) azt jelenti, hogy a
fny a trgy felsznn bellre hatol, a trgy a fnyt elnyeli s ismtelten kisugrozza. A tkletesen diffz
(avagy Lambert-fle) fellet minden irnyban azonos intenzitssal szrja a fnyt. Az intenzits egyedl a
fnyforrstl rkez fny beessi szgtl fgg: a felletre pontosan merleges fnyforrs esetn lesz a
legnagyobb intenzits a reflexi, mg majdnem prhuzamos fnyforrs esetn a legkisebb. E kt vglet kztt a
viszszaverdst Lambert koszinusztrvnye rja le:
I = kI0cos
ahol s a fnyforrs intenzitsa, a fellet normlisa s a fny beessi irnya kztti szg, k a visszaverdsi
tnyez rtke, amely a fellet visszaversi kpessgeitl fgg, s 0-tl (tkletesen fekete fellet) 1-ig
(tkletesen fehr fellet) vltozik.
A valdi letben a felletek kevert, diffz s tkrs tulajdonsgak. Szmtgpes modellezsk a szmtgpes
grafika f alkalmazsi terlete. A valsgh kpek ellltsa ltalban fnysugr-kvetsi eljrssal trtnik,
amely szimullja azt a fizikai folyamatot, ahogy a fnysugr a forrsnl keletkezik, s a trgyakrl tbbszrsen
visszaverdik.
766
Created by XMLmind XSL-FO Converter.
Az szlels
A 15.2. alfejezetben a simts (smoothing) azt jelentette, hogy egy llapotvltoz rtkt jsoltuk meg
valamilyen mltbeli t idpontra, bizonyos, a t idpontra s tovbbi, egszen a jelenig terjed idpontokra
vonatkoz tnyek ismeretben. Most ugyanezt az tletet alkalmazzuk a trbeli kiterjedsre az idbeli helyett: a
simts egy kppont rtknek jslst jelenti a krnyez kppontok alapjn. Vegyk szre, hogy vilgosan
megklnbztetjk a kppontban mrt megfigyelt rtket s azt a valdi rtket, amit ott mrnnk kellett volna.
Ezek vletlenszer s szisztematikus mrsi hibk (pldul ha a CCD rzkelje elromlott) miatt
klnbzhetnek.
A simts egyik mdszere az, ha minden kpponthoz az t krnyez szomszdok rtkeinek tlagt rendeljk.
Ez az extrm rtkek kihagysa fel mutat megolds. De hny szomszdot kell figyelembe vennnk az egy
kppontnyi tvolsgra vagy a kett esetleg tbb pont tvolsgra lvket? Erre egy vlasz, amely jl mkdik
Gauss-zajok kiszrsre, a Gauss-szrt (Gaussian filter) hasznl slyozott tlag. Emlkezznk a standard
szrssal rendelkez Gauss-fggvnyre:
Egy Gauss-szr alkalmazsa azt jelenti, hogy az I(x0, y0) intenzitst lecserljk a minden (x, y)-ra kiszmolt I(x,
y)G(d) intenzitsok sszegvel, ahol d az (x0, y0) s az (x, y) pontok tvolsga. Az ilyen fajta slyozott sszeg
olyan gyakori, hogy van szmra egy specilis elnevezs s jells. Azt mondjuk, hogy a h fggvny az f s a g
fggvnyek konvolcija (convolution) (amit h = f g alakban runk), ha
Azaz a simtott fggvnyt gy kapjuk, hogy a kpet a Gauss-fggvnnyel konvolvljuk: I G. Egy kppontnyi
kevs zaj kisimtshoz elegend, mg 2 kppontnyi tbb zajt fog elsimtani, de valamilyen mrtk
rszletveszts mellett. Mivel a Gauss-hats a tvolsggal eltnik, a gyakorlatban a a szummkban 3-val
helyettesthet.
3.1. ldetektls
Az elzetes lts kvetkez lpse az lek (edges) detektlsa a kpskon. Az lek olyan egyenes vagy grbe
vonalak a kpskon, amelyekre merlegesen a kp fnyessgben lnyegesen vltozs van. Az ldetektls
vgs clja, hogy eltvolodjunk a bonyolult, tbb megabjtos kptl egy tmrebb, absztrakt reprezentci fel,
mint amilyen a 24.4. brn lthat. Az indtk az, hogy a kp lkontrjai a jelenet fontos kontrjainak felelnek
meg. A kpen hrom mlysgi diszkontinuits plda szerepel 1-gyel cmkzve; a 2-vel cmkzett felleti
orientci diszkontinuitsbl kt plda lthat, mg a 3-mal cmkzett visszaverdsi kpessg
diszkontinuitsokrl s a 4-gyel cmkzett fnyessgi diszkontinuitsokrl (rnyk) egy-egy. Az ldetektls
csak a kppel foglalkozik, gy nem tesz klnbsget a jelenet ezen diszkontinuitsfajti kztt, de a ksbbi
feldolgozs igen.
A 24.5. (a) bra egy asztalon nyugv tzgpet tartalmaz jelenet kpt mutatja, a 24.5. (b) pedig a kpre
lefuttatott ldetektl algoritmus eredmnyt mutatja. Lthatjuk, hogy az ldetektl kimenete s az idelis
vonalas bra kztt van klnbsg. A kis rszek lei nem mind illeszkednek egymshoz, vannak hzagok, ahol
nincsenek vonalak, valamint zajos kontrok, amelyek a jeleneten semmilyen lnyeges vonsnak nem felelnek
meg. A ksbbi feldolgozsi fzisokban ezeket a hibkat majd korriglni kell. Hogyan detektljuk a kpen az
leket? Figyeljk meg a kp fnyintenzits-profiljt egy egydimenzis keresztmetszet mentn egy lre
merleges irnyban, pl. az asztal bal le s a fal kztt. Nagyjbl olyan lesz ez, mint amit a 24.6. (a) bra
mutat. Az l helye az x = 50-nek felel meg.
767
Created by XMLmind XSL-FO Converter.
Az szlels
24.4. bra - Klnfle lek: (1) mlysgi diszkontinuits, (2) felleti orientci
diszkontinuits, (3) viszszaverdsi kpessg diszkontinuits, (4) fnyessgi
diszkontinuits (rnykok)
24.5. bra - (a) Egy asztalon nyugv tzgp fnykpe. (b) Az (a) alapjn meghatrozott
lek.
Tekintettel, hogy az lek azoknak a kphelyeknek felelnek meg, ahol a fnyessgben hirtelen vltozs
tapasztalhat, egy naiv tlet az lehetne, hogy a kpet differenciljuk, s azokat a helyeket keressk meg, ahol az
I'(x) derivlt rtke nagy. Nos, az tlet majdnem mkdkpes. A 24.6. (b) brn lthatjuk, hogy az x = 50
csccsal egytt ms helyeken, msodlagos cscsok is megjelentek (pldul x = 75), amiket tvesen valdi
leknek fogadhatunk el. A jelensg oka a kp zajossga. Ha a kpet elszr simtjuk, akkor a felesleges cscsok
eltnnek, ahogy azt a (c) mutatja.
24.6. bra - Fell: Az I(x) intenzitsprofil egy egydimenzis rszlet mentn egy lpcsfok
ln t. Kzpen: Az intenzits derivltja, I'(x). A fggvny nagy rtkei leknek
felelnek meg, de a fggvny zajos. Lent: Az intenzits simtott vltozatnak derivltja,
(I G )', amely I G'-hoz hasonlan egy lpsben szmolhat. Az x = 75 pontban lev
zajos l jellt eltnt.
768
Created by XMLmind XSL-FO Converter.
Az szlels
Van arra eslynk, hogy optimalizljuk a munkt ezen a ponton: egyetlen mveletben kombinlhatjuk a simtst
s az ldetektlst. Egy ttel szerint tetszleges f s g fggvnyek esetn megmutathat, hogy a konvolci
derivltja (f g)' megegyezik a derivlt konvolcijval: f (g)'. Teht ahelyett, hogy elszr simtannk,
majd differencilnnk, egyszeren konvolvljuk a kpet a Gauss simt fggvny derivltjval, G'-val. gy az
egydimenzis ldetektls algoritmusa a kvetkez:
1. Az I kpet a G'-val kell konvolvlnunk, hogy az R-et megkapjuk.
2. Jelljk be az azokat a cscsokat ||R(x)||-ben, amelyek egy elre definilt T kszbnl magasabbak. A kszb
rtkt gy hatrozzuk meg, hogy a zaj miatti msodlagos cscsokat eliminljuk.
Kt dimenziban egy l irnytottsga tetszleges szg lehet. A fggleges lek detektlsnak mdja
nyilvnval: G'(x) G(y)-nal kell konvolvlnunk a kpet. A hats y irnyban simt (a Gauss-konvolci miatt),
x irnyban pedig egy simtssal ksrt differencils. A fggleges lek detektlsi algoritmusa gy az albbi:
1. Konvolvljuk az I (x, y) kpet az fV(x, y) = G' (x) G (y)-nal, hogy az RV(x, y) -t megkapjuk.
2. Jelljk be azokat a cscsokat az ||RV (x, y)||-ben, amelyek egy elre definilt Tn kszbnl magasabbak.
A tetszleges orientcij l detektlshoz a kpet kt szrvel: az fV = G'(x) G(y) s az fH = G'(y) G(x)
szrvel kell konvolvlni (az fH az fV 90-kal elforgatott vltozata). A tetszleges orientcij ldetektl
algoritmus az albbi:
1. Konvolvljuk az I (x, y) kpet az fV (x, y)-nal, valamint az fH (x, y)-nal, hogy az RV(x, y)-t s az RH(x, y) -t
megkaphassuk. Definiljuk az
-t.
2. Jelljk be azokat a cscsokat az ||R(x, y)||-ban, amelyek egy elre definilt T kszbnl magasabbak.
Miutn ezzel az algoritmussal megjelltk az lek kppontjait, a kvetkez lps az azonos lekhez tartoz
kppontok sszektse. Ez megtehet, ha felttelezzk, hogy brmely kt szomszdos kppont, amely lpont s
769
Created by XMLmind XSL-FO Converter.
Az szlels
3.2. A kp szegmentlsa
Az emberek rendszerezik szlelseiket; az egyes fotrzkelkhz tartoz fnyessgrtkek halmaza helyett
vizulis csoportokat szlelnk, amelyek ltalban objektumokkal vagy azok rszeivel asszociltak. Ez a
kpessg a szmtgpes lts szmra is ppgy fontos.
A szegmentls (segmentation) a kp felbontsa rszcsoportokra a kppontok hasonlsga alapjn. Az
alaptlet a kvetkez: minden kpponthoz rendelhetnk bizonyos vizulis tulajdonsgokat, mint pldul
fnyessg, szn s mintzat.2 Ezek az attribtumok egy objektumon vagy annak egyetlen rszn bell, csak
kismrtkben vltoznak, mg az objektumok kztti hatrok mentn tipikusan egyik vagy msik attribtum
jelentsen vltozik. gy kell a kpet kppontok halmazaira felosztanunk, hogy ezeket a knyszereket amennyire
csak lehet, kielgtsk.
Tbbfle mdszer ltezik ezen intuitv elkpzels matematikai formalizlsra. Pldul Shi s Malik (Shi s
Malik, 2000) ezt grfparticionlsi problmaknt hatrozzk meg. A grf csompontjai a kppontoknak felelnek
meg, az lek pedig a kztk lev kapcsolatoknak. Egy Wij sly rtke az i s j kppontokat sszekt len attl
fgg, hogy a kt kppont mennyire hasonl fnyessgben, sznben, mintzatban s ms tulajdonsgokban. Ezek
utn olyan partcikat keresnek, amelyek minimalizlnak egy normalizlt vgsi kritriumot. Durvn
fogalmazva a grf particionlsnak kritriuma, hogy a csoportok kztti lek slyainak sszegt
minimalizljuk, a csoportokon belli lek slyainak sszegt pedig maximalizljuk.
A pusztn alacsony szint, helyi tulajdonsgokon pldul a fnyessgen s sznen alapul szegmentci
hibzsra hajlamos eljrs. Ahhoz, hogy az objektumokhoz rendelt hatrokat megbzhatan megtallhassuk, a
jelenetben vrhat objektumfajtkrl magas szint tudst is be kell ptennk. A beszdfelismersre ezt a rejtett
Markov-modell formalizmusa teszi lehetv, mg a kpek kontextusban egy ilyen egysges keretrendszer mg
mindig az aktv kutats trgya. Mindenesetre az objektumokrl szl magas szint tuds a kvetkez alfejezet
trgya.
4. D informci kinyerse
Ebben az alfejezetben azt mutatjuk meg, hogyan kell a ktdimenzis kpbl kiindulva a jelenet hromdimenzis
reprezentcijig eljutni. Fontos, hogy a jelenettel foglalkozzunk, hiszen vgs soron az gens a vilgban
ltezik, nem a kpskon, a lts clja pedig annak elrse, hogy az gens a vilg objektumaival egyttmkdjn.
Mindazonltal az gensek tbbsgnek csak a jelenet egyes aspektusainak korltozott absztrakt
reprezentcijra van szksge, nem minden rszletre. A knyv htralev rszben lthat, a vilggal
foglalkoz algoritmusok az objektumok tmr lersra ptenek, nem minden hromdimenzis felletdarabka
kimerten teljes szmbavtelre.
Elsknt az objektumfelismerst (object recognition) trgyaljuk, azt a folyamatot, amely sorn a kpek
jellemzi (mint pldul az lek) talakulnak ismert objektumok (mint pldul a tzgpek) modelljeiv. Az
objektumfelismers hrom lpsbl ll: a jelenet szegmentlsa klnll objektumokra, mindegyik objektum
pozcijnak s trbeli orientcijnak a megfigyelhz kpesti meghatrozsa, valamint mindegyik objektum
alakjnak a meghatrozsa.
A manipullsi s a naviglsi feladatok szempontjbl legfontosabb az objektum pozcijnak s trbeli
orientcijnak (az objektum n. helyzetnek pose) a meghatrozsa a megfigyelhz kpest. Ahhoz, hogy
egy nyzsg gyrban eligazodjunk, tudnunk kell az akadlyok elhelyezkedst, mert akkor egy olyan plyt
tudunk tervezni, amely az akadlyokat kikerli. Ha egy trgyat szeretnnk felvenni s kzben tartani, a kzhez
kpesti helyzetet kell ismernnk, mert csak gy tudjuk generlni a megfelel plyj cselekvsszekvencit. A
manipullst s a naviglst tipikusan szablyozsi hurokban oldjuk meg az rzkelk informcija
visszacsatolst jelent, amivel a robot vagy a robotkar mozgst befolysolni tudjuk.
770
Created by XMLmind XSL-FO Converter.
Az szlels
Hasznljunk most matematikai jellst a pozci s az orientci lersra. A jelenet egy P pontjnak a
pozcijt hrom szm jellemzi, a P pont (X, Y, Z) koordinti a sttkamra nylsban elhelyezett origj s az
optikai tengellyel parallel Z tengely koordinta-rendszerben (lsd 24.1. bra). Amivel rendelkeznk, az a kp
egy pontjnak (x, y) perspektivikus vetlete. Ez egyben a fnysugarat is definilja a nyls fell, amely mentn
valahol elhelyezkedik a P pont. A P pont tvolsgt azonban nem ismerjk. Az orientci fogalmt ktfle
rtelemben lehet hasznlni:
1. Az objektum egsznek az orientcija. Ezt egy hromdimenzis forgatsi fggvnyben specifiklhatjuk,
az objektum koordinta-rendszert a kamerhoz viszonytva.
2. Az objektum felletnek az orientcija a P pontban. Ez egy n norml vektorral adhat meg, amely a
felletre merleges irnyt hatrozza meg. A fellet orientcijt sokszor a lejtssel (slant) s a dlssel (tilt)
fejezzk ki. A dls az n s a Z tengely ltal bezrt szg. A lejts az X tengely s az n kpskra vett vetlete
ltal bezrt szg.
Amikor a kamera a trgyhoz kpest elmozdul, az objektumnak mind a tvolsga, mind az orientcija
megvltozik. Ami viszont nem fog vltozni, az a trgy alakja (shape). Ha a trgy pl. egy kocka, akkor a kocka
jellege nem vltozik, ha a trgy mozog. A geometria kutati szzadok ta prblkoznak az alak fogalmnak
formalizlsval abbl az alaptletbl kiindulva, hogy az alak az a valami, ami bizonyos
transzformcicsoport pl. a forgatsok s a transzlcik kombincii hatsra nem vltozik. A nehzsg
abban rejlik, hogy hogyan keressk meg a globlis alak egy olyan reprezentcijt, amely elegenden ltalnos
ahhoz, hogy a valdi vilg alakbeli vltozkonysgt s nem csupn oly egyszer formkat, mint a hengerek, a
kpok s a gmbk lefedje, s mgis knnyen kinyerhet legyen a vizulis bemenetbl. A fellet loklis
alakjnak a jellemzse sokkal jobban feltrt. Ez lnyegben a grblettel lehetsges azaz azzal, hogy hogyan
vltozik a fellet normlisa, ha a felleten klnbz irnyokba elmozdulunk. A sk esetn egyltaln nincs
vltozs. A henger esetn sincs, ha a tengely mentn haladunk, a r merleges irnyban azonban a normlis, a
henger sugarval fordtottan arnyos temben forog. Ezekkel a krdsekkel a differencilgeometria foglalkozik.
A trgy alakja bizonyos manipulcis feladatok szempontjbl fontos, pl. ahhoz, hogy eldntsk, hogy a trgyat
hol fogjuk meg. Legfontosabb szerepe azonban a trgyak felismersben van, ahol a geometriai alak a sznnel s
a textrval egyetemben a legjellemzbb vonst jelenti, hogy a trgyakat azonosthassuk, a kp tartalmt a
korbban ltott osztlyokba besoroljuk s gy tovbb.
Az alapvet problma a kvetkez: ha egyszer a perspektivikus vetts alatt a hromdimenzis vilg egy pontbl
kiindul sugr mentn tallhat minden pontja a kpnek ugyanabba a pontjba vettdtt, hogyan nyerjk vissza
a hromdimenzis informcit? A vizulis rzkelsben ehhez szmos segt dolog ll rendelkezsre, a
mozgst, a sztereoltst, a textrt, az rnyalst s a kontrokat belertve. Ezek mindegyike, ahhoz hogy a
kp rtelmezst (kzel) egyrtelm mdon megoldhassa, a jelenetre vonatkoz httr-felttelezseken alapul.
Az albbiakban ezekkel a mdszerekkel foglalkozunk.
4.1. A mozgs
Eddig egy idpontban csak egy kppel foglalkoztunk. A videokamerk azonban msodpercenknt 30 kpkockt
rgztenek, s a kockk kztti klnbsgek fontos informcik forrsai lehetnek. Abban az esetben, ha a
kamera a hromdimenzis jelenethez kpest mozog, a kpen keletkez ltszlagos mozgst optikai folyamnak
(optical flow) nevezzk. A folyam a kpbeli jellegzetessgek mozgsirnyt s mozgsi sebessgt rja le, amit
a jelenet s a megfigyel egymshoz viszonytott relatv mozgsnak kvetkeztben kapunk. A 24.7. (a) s (b)
brn egy forg Rubik-kockt brzol videofelvtelbl ltunk kt filmkockt. A (c) kpen az elbbi kpekbl
szmtott optikai folyam vektorai lthatk. Az optikai folyam a jelenet struktrjra nzve tartalmaz hasznos
informcit. Pldul egy mozg kocsibl kinzve a tvoli trgyaknak sokkal lassbb a ltszlagos mozgsa,
mint a kzelieknek, gy a ltszlagos mozgs teme a tvolsgrl is hordoz valamifle informcit.
Az optikai folyam vektormezeje az x irny vx(x, y) s az y irny vy(x, y) komponensekkel jellemezhet. Ahhoz,
hogy az optikai folyamot megmrhessk, meg kell tallni az egymsnak megfelel pontokat a szomszdos
kpkockkon. Ehhez azt a tnyt hasznljuk fel, hogy az egymsnak megfelel pontok krli kprszeknek
hasonl a fnyessgmintzata. Tekintsk a p, (x0, y0) kppont krl t0 idpillanatban csoportosul
kpponttmbt. Ezt a tmbt a t0 + Dt idpillanatban a klnbz (x0 + Dx, y0 + Dy) pozcij qi kppontjelltek
krl csoportosul kpponttmbkkel ssze kell hasonltani. A hasonlsg egyik szba jhet mrtke a
klnbsgek ngyzetsszege (sum of squared differences, SSD):
771
Created by XMLmind XSL-FO Converter.
Az szlels
24.7. bra - (a) Rubik-kocka egy forg lemezkorongon. (b) Ugyanaz a kocka 19/30
msodperccel ksbb (Richard Szeliski nyomn). (c) Az (a) s (b) kpek
sszehasonltsa alapjn szmolt optikai folyam vektorok (Joe Weber s Jitendra Malik
hozzjrulsval).
Az (x, y) az (x0 , y0) kppont krli tmb kppontjainak halmazn fut vgig. Megkeressk most azt a (Dx, Dy)-t,
amely az SSD-t minimizlja. Az (x0 , y0)-beli optikai folyam ilyenkor: (vx , vy) = (Dx/Dt, Dy/Dt). Alternatvaknt
maximalizlhatjuk a keresztkorrelcit (cross-correlation):
A keresztkorrelci akkor hasznlhat a legjobban, ha a jelenet kpben textra tallhat, mert ekkor a vizsglt
ablakokban nagy a fnyessgvltozs a kppontok mentn. Ha egy egyenletesen fehr falra nznk, a klnbz
q jelltekre szmtott keresztkorrelci majdnem azonos lesz, s az algoritmus a gyakorlatban vletlenszeren
fog vlasztani.
Tegyk fel, hogy a megfigyel T transzlcis s szgsebessggel rendelkezik [amelyek gy a sajtmozgst
(egomotion) rjk le]. Szrmaztatni lehet olyan sszefggseket, amelyek a megfigyel sebessgt, az optikai
folyamot s a jelenet trgyainak a pozcijt kapcsoljk ssze. Tegyk fel, hogy f = 1, akkor:
lesz. Nhny rdekes tulajdonsgot figyelhetnk meg. Az optikai folyam mindkt komponense, vx(x, y) s vy(x,
y) is zrus az x = Tx/Tz, y = Ty/Tz pontban. Ezt a pontot a folyammez expanzifkusznak (focus of expansion)
nevezzk. Tegyk fel, hogy az x y sk origjt az expanzifkuszba helyezzk t. Ilyenkor az optikai folyam
kifejezsei igen egyszer formt ltenek. Jellje (x', y') az x' = x Tx /Tz, s az y' = y Ty /Tz ltal definilt j
koordintkat. Ekkor:
772
Created by XMLmind XSL-FO Converter.
Az szlels
Ennek az egyenletnek van nhny rdekes alkalmazsa. Tegyk fel, hogy n egy lgy, amely egy falra prbl
leszllni, s azt szeretn tudni, hogy adott aktulis sebessg mellett mennyi id mlva r a falhoz. Ezt az idt a
Z/Tz adja meg. Figyeljk meg, hogy annak ellenre, hogy a pillanatnyi optikai folyam nem kpes sem a Z
tvolsgot, sem a Tz sebessgi komponenst megadni, a kett arnyt meg tudja adni, s gy a leszlls
irnytsban felhasznlhat. Az l legyekkel val ksrletek altmasztjk, hogy a legyek pontosan ezt a
mechanizmust hasznljak. A legyek a legmerszebb replk az llatok s gpek kztt, s rdekes, hogy ezt egy
olyan ltrendszerrel teszik, amelynek borzasztan gyenge a trbeli felbontsa (krlbell 600 rzkelje van,
sszehasonltva az emberek 100 millijval), de kiemelked az idbeli felbontsa.
24.8. bra - (a) Egy olyan videokp-sorozat ngy kockja, amelyben a kamera a
trgyhoz kpest mozgott s forgott. (b) A sorozat els kpkockja, amelyen apr
ngyzetek jelzik a tulajdonsgfelismer ltal megtallt tulajdonsgokat (Carlo Tomasi
hozzjrulsval).
773
Created by XMLmind XSL-FO Converter.
Az szlels
A mlysg kiszmtshoz tbb kpkocka hasznlata szksges. Ha a filmre egy merev testet vesznk fel, akkor
ennek alakja kpkockrl kpkockra nem fog vltozni, s gy az optikai folyam termszetnl fogva zajos
mrseit jobban kezelhetjk. Az egyik ilyen megkzelts eredmnyt a 24.8. s a 24.9. brn lthatjuk (Tomasi
s Kanade, 1992).
774
Created by XMLmind XSL-FO Converter.
Az szlels
Dolgozzuk ki a diszparits s a mlysg geometriai kapcsolatt. Elszr azt az esetet vizsgljuk meg, amikor a
kt szem (illetve a kt kamera) elrenz, s optikai tengelyk prhuzamos. A jobb s a bal kamera kapcsolata
gy egy b nagysg (bzisvonal) transzlci az x koordinta-tengely mentn. A H = vx t vzszintes s V = vyt
fggleges kpeltrs szmtshoz az optikai folyam elbb megismert kifejezseit hasznlhatjuk, Tx = b/t, Ty
= Tz = 0 mellett. Az x, y, s z rotcis paramterek zrusok. Azt kapjuk eredmnyl, hogy H = b/Z s V = 0.
Szavakkal megfogalmazva ez azt jelenti, hogy a vzszintes kpeltrs a bzisvonal s a mlysg arnya, a
fggleges eltrs pedig zrus.
Normlis ltsi krlmnyek kztt az emberek fixlnak, azaz sszetartan nznek elre (fixate), vagyis a
jelenetben ltezik egy olyan pont, amelyben a kt optikai tengely metszi egymst. A 24.11. bra egy P0 pontra
fixl szemeket mutat, amely pont a kt szem kzpvonaltl Z tvolsgban helyezkedik el. Az egyszersg
kedvrt szgeltrst fogunk szmtani radinban. Az sszetarts P0 pontjban az eltrs zrus. A jelenet egy Zvel tvolabbi P pontja esetn szmthatjuk a P pont PL bal s a PR jobb oldali kpnek a szgeltoldst. Ha azok
mindegyike a P0 -hoz kpest /2 szggel eltolt, akkor a PL s a PR eltoldsa, ami a P kpeltrse, pontosan .
Egyszer geometriai talaktsokbl azt fogjuk kapni, hogy:
Embereknl a b bzisvonal (baseline) kb. 6 cm. Tegyk fel, hogy Z kb. 100 cm. A legkisebb detektlhat
(ami a kppont nagysgval fgg ssze) kb. 5 szgmsodperc, avagy 2,42 10 5 radin, amibl a Z 0,4 mm-re
addik. Z = 30 cm-re Z = 0,036 mm-es lenygz rtket kapunk. Ez azt jelenti, hogy 30 cm-es tvolsgban az
emberek akr a 0,036 mm-es kpmlysg klnbsg megklnbztetsre is kpesek. Ez teszi lehetv, hogy be
tudjuk fzni a crnt egy tbe, s hasonl mveleteket tudunk elvgezni.
4.3. Textragradiensek
A mindennapi nyelvben a textra vagy felletmintzat (texture) a fellet kitapinthat tulajdonsgaira
vonatkozik (az angol nyelvben ugyanazzal a sztvel rendelkezik, mint maga a szvet 3). A szmtgpes
ltsban a textra egy ehhez kzeli fogalomra, egy felletnek a skban ismtld, vizulisan rzkelhet
mintzatra vonatkozik. Pldaknt emlthetjk egy plet ablakainak a mintzatt, egy szvetter ktsi mintjt, a
leoprd foltos bundjt, a pzsit fszlainak a mintzatt, kavicsokat a strandon vagy embertmeget egy
stadionban. Az elrendezs nha kzel periodikus, mint pldul a ktsi szemek a szvetteren, ms esetekben,
mint pldul a strandon lv kavicsok esetn, a szablyossg csak statisztikai rtelemben ltezik a kavicsok
srsge a strand klnbz rszein nagyjbl azonos.
24.12. bra - (a) A textragradienseket illusztrl jelenet. Feltve, hogy a vals mintzat
egyforma, lehetv teszi a fellet irnygnak a meghatrozst. A szmtott irnyt a
kpen oly mdon elhelyezett fehr kr s nyl jelzi, mintha a krt a felletre festettk
volna abban a pontban. (b) Egy velt fellet alakjnak meghatrozsa a mintzat
3
775
Created by XMLmind XSL-FO Converter.
Az szlels
Amit most a jelenetre vonatkozan lltottunk, igaz. A kpen a textraelemek vagy texelek (texels) ltszlagos
nagysga, alakja, tvolsga stb. igencsak vltozik, ahogy ezt a 24.12. bra mutatja. A csempelapok a jeleneten
azonosak. A lapok kivettett nagysgnak s alakjnak megvltozsban kt f ok jtszik szerepet:
1. Az egyes texeleknek a kamertl vett vltoz tvolsga. Emlkezznk arra, hogy a perspektivikus vettsben a
tvoli trgyak kisebbnek tnnek. A sklatnyez 1/Z.
2. Az egyes texelek vltoz rvidlse. Ez a texeleknek a kamerbl kiindul rltsi irnyhoz viszonytott
orientcijn mlik. Rvidls nincs, ha a texel a rltsi irnyra merleges. A rvidls mrtke cos -val
arnyos, ahol a a texel skjnak a lejtse.
Egy kevs matematikai elemzst kveten meghatrozhatjuk a klnbz texeltulajdonsgok, mint pl. a terlet,
a rvidls s a srsg vltozsi mrtknek kifejezseit. Ezek az n. textragradiensek (texture gradients) a
fellet alakjnak s a megfigyelhz kpesti dlsnek s lejtsnek a fggvnyei.
Ahhoz, hogy az alakot a textrbl kinyerhessk, ktlpcss eljrshoz kell folyamodnunk: (a) elszr mrjk a
textragradienseket; (b) majd becsljk a mrt gradienseket okozni ltsz felletalakot, azok dlst s lejtst.
A 24.12. bra mutatja ezen eljrs eredmnyeit.
4.4. rnyals
Az rnyalst (shading) a jelenethez tartoz fellet klnbz rszeirl kapott megvilgts
intenzitsvltozst a jelenet geometrija s a fellet-visszaversi tulajdonsgai hatrozzk meg. A
szmtgpes grafikban a feladat a kp I(x,y) fnyessgfggvnynek a megadsa, ha a jelenet geometrija s a
visszaverdsi tulajdonsgok adottak. A szmtgpes ltsban azt remljk, hogy ez a folyamat invertlhat,
vagyis visszallthatjuk a jelenet geometrijt s visszaverdsi tulajdonsgait, ha az I(x,y) kpfnyessg adott.
A problma olyan nehznek bizonyult, hogy a legegyszerbb esetektl eltekintve e tren nem sikerlt
eredmnyeket elrni.
Induljunk ki egy olyan pldbl, ahol az alakot tnyleg visszanyerhetjk az rnyalsbl. Tekintsnk egy
Lambert-fle felletet, amit egy tvoli, pontszer fnyforrs vilgt meg. Ttelezzk fel azt is, hogy a fellet
messze van a kamertl, gy fggleges sk vettst fogunk hasznlni a perspektivikus vetts megkzeltsre.
A kp fnyessge:
I(x, y) = kn(x, y) s
ahol k egy sklaegytthat, n a fellet norml egysgvektora s s a fnyforrs irnyba mutat egysgvektor.
Mivel n s s egysgvektorok, skalrszorzatuk a kett kztti szg koszinusza. A fellet alakjt az n fellet menti
vltozsa tartalmazza. Ttelezzk fel, hogy k s s ismertek. A problmnk most a fellet n normlisnak a
kiszmtsa, ha az I(x,y) kpfnyessg adott.
Az els megjegyzs, amit meg kell tenni, az az, hogy az n meghatrozsa az adott (x,y) kppontfnyessg
ismeretben loklisan alulhatrozott. Ki tudjuk ugyan szmtani az n s a fnyforrs kztti szget, ez azonban
776
Created by XMLmind XSL-FO Converter.
Az szlels
az n-et csak annyiban korltozza, hogy egy bizonyos, s irny s = cos1(I/k) palstszg kp felletn
helyezkedik el. Hogy tovbblphessnk, jegyezzk meg, hogy kppontrl kppontra az n vltozsa nem lehet
tetszleges. Egy sima fellet normlisa csak sima mdon vltozhat amely korltozst az integrlhatsg
(integrability) szakkifejezssel jelljk. Ezt a felismerst szmos mdszerben fel is hasznljk. Egy lehetsges
eljrs az n trsa a Z(x,y) mlysg Zx s Zy parcilis derivltjainak felhasznlsval. Ennek eredmnye Z egy
parcilis differencilegyenlete, amit megfelel hatrfelttelek figyelembevtelvel Z(x,y)-ra nzve meg lehet
oldani.
Az eljrs ltalnosthat. Nem szksges, hogy a fellet Lambert-fle legyen, s az sem, hogy a fnyforrs
pontszer legyen. Lnyegben ugyanez a mdszer hasznlhat, ha sikerl a fellet R(n) reflektanciatrkpt
(reflectance map) meghatrozni, amely a felletelem fnyessgt annak n normlisa fggvnyben fejezi ki.
Az igazi nehzsg a klcsns visszaverdsek kezelse. Egy tipikus belstrjelenet esetn, mint pldul egy
irodban lv trgyak esetn a felleteket nem csupn a fnyforrsok vilgtjk meg, hanem a jelenet ms
felleteitl visszavert fny is, amelyek tnyleges msodlagos fnyforrsokknt szolglnak. Ezek a klcsns
megvilgtsi hatsok igen jelentsek lehetnek. Az ilyen helyzetben a reflektanciatrkp megkzelts teljes
mrtkben hasznlhatatlan a kp fnyessge nemcsak a normlison mlik, hanem a jelenet klnbz
felleteinek bonyolult trbeli viszonyain is.
Az ember az rnyalsbl kpes valamilyen mrtk alakinformci kinyersre, gy ez a problma minden
nehzsge ellenre tovbb is rdekes marad.
4.5. Kontrok
Amikor egy olyan vonalas rajzot nznk, mint amilyen a 24.13. bra, a kp egy hromdimenzis elrendezs
letszer benyomst kelti bennnk. Hogyan lehetsges ez? Hiszen lttuk korbban, hogy egy s ugyanaz a
vonalas kp vgtelen sok jelenet konfigurcibl szrmazhat. Figyeljk meg, hogy mg a felszn lejtsnek s
emelkedsnek rzett is megkapjuk. Ez minden bizonnyal (a tipikus alakzatokra vonatkoz) magas szint tuds
s valamilyen alacsony szint knyszerek sszekapcsolsnak kvetkeztben lehetsges.
A vonalas brban rejl kvalitatv tudssal fogunk foglalkozni. Korbban lttuk, hogy a rajz vonalainak
klnfle lehet a fontossga (lsd 24.4. bra s ksrszvege). Az a folyamat, ahogy a kp minden vonalnak a
tnyleges fontossgt megllaptjuk, a vonalcmkzs (line labeling), s ez volt a szmtgpes lts ltal
elsknt tanulmnyozott problmk egyike. Tegyk fel egyelre, hogy a vilg olyan leegyszerstett
modelljvel dolgozunk, ahol a trgyaknak nincsenek felletei, s ahol az olyan vonalakat, amelyek
megvilgtsi diszkontinuitsokbl addnak, mint amilyenek az rnyklek s a tkrzsek, valamilyen
777
Created by XMLmind XSL-FO Converter.
Az szlels
elfeldolgoz eljrssal a kpbl kiemeltk. A figyelmnket gy olyan vonalas brkra sszpontosthatjuk, ahol
minden vonal vagy mlysgi, vagy orientci diszkontinuitshoz tartozik.
Mindegyik vonalat ezek utn vagy egy a fellet hatrn megjelen pszeudol (limb) vetletnek (ami a fellet
azon pontjainak sszessge, ahol a rlts irnya a fellet rintje), vagy egy lnek (edge) lehet tekinteni (ami a
fellet normlisnak egy diszkontinuitsa). Az leket tovbb konvex, konkv vagy hatrol losztlyokba
sorolhatjuk. A pszeudolek s a hatrol lek esetn rdekes annak az eldntse, hogy a vonalas brn a grbt
hatrol kt felletbl melyik van hozznk kzelebb. Ezeket a kvetkeztetseket gy kpzelhetjk el, hogy
mindegyik vonalhoz a 6 lehetsges vonalcmknek (line label) az egyikt rendeljk hozz, ahogy az a 24.14.
brn lthat.
778
Created by XMLmind XSL-FO Converter.
Az szlels
A 24.15. bra mutatja azt a ngyfle helyzetet, ahogy a hrom skfellet egy sarokpontban tallkozhat. Ezeket az
eseteket gy szerkesztettk, hogy egy kockt nyolc oktnsra (octant) bontottunk. A trideres sarokpontok egsz
vlasztkt szeretnnk generlni a kocka kzppontjban gy, hogy a klnbz oktnsokat kitltjk. Az 1-es
cmkj sarokpont az egyetlenegy kitlttt oktnshoz tartozik, a 3-as cmkj a hrom kitlttt oktnshoz s gy
tovbb. Az olvasnak kellene beltnia, hogy ezek tnyleg kimertik az sszes lehetsges helyzetet. Ha valaki
pldul a kockban kt oktnst kitlt, akkor nem lesz kpes a kzppontban egy rvnyes trideres sarokpontot
megszerkeszteni. Jegyezzk meg azt is, hogy ezen ngy eset a sarokpontban tallkoz konvex s konkv lek
klnbz kombinciinak felel meg.
A sarokpontban tallkoz hrom l a krlttk lv teret nyolc oktnsra osztja. A sarokpontot brmely,
anyaggal nem kitlttt oktnsbl lehet szemllni. A nzpont oktnson belli elmozdtsa a kpen lthat
csatlakozsok jellegt megvltoztatni nem fogja. A 24.15. brn lthat 1-es cmkj sarokpontot a marad ht
oktnsbl szemllve a 24.16. brn lthat csatlakozscmkket kapjuk.
Annak kimert vizsglata, hogy egy sarokpont milyen mdon lthat, a 24.17. brn felsorolt lehetsgekhez
vezet. A kpen ngy klnbz csatlakozstpust azonosthatunk: L, Y, nyl- s T csatlakozst. Az L csatlakozs
a kt lthat l esete. Az Y s a nylcsatlakozs hrom lnek felel meg. Az Y csatlakozsban a szgek egyike
sem lpi tl a 180-ot. A T csatlakozs a takarssal kapcsolatos. Ha egy kzeli, nem tltsz fellet egy
tvolabbi lt eltakar, egy fl llel tallkoz folytonos lt kapunk. A T csatlakozs ngy cmkje a ngyfle l
takarsnak felel meg.
779
Created by XMLmind XSL-FO Converter.
Az szlels
Ha egy vonalas rajzot ennek a csatlakozssztrnak a segtsgvel cmkznk meg, a problma annak a
megllaptsa, hogy mely csatlakozsinterpretcik lesznek globlisan konzisztensek. A konzisztencit az a
szably knyszerti ki, miszerint a rajzon egy vonalnak egy s csakis egy cmkje lehet a vonal egsz hosszban.
Ezen problma algoritmikus megoldst Waltz adta meg (pontosabban egy olyan kibvtett problma
megoldst adta meg, amely az rnykot, a grbleti diszkontinuitsokat [repedseket] s a sztvlaszthatan
konkv leket is figyelembe veszi [Waltz, 1975]). Az algoritmus a knyszerkielgts egyik legels alkalmazsa
volt az MI terletn (lsd 5. fejezet). A knyszerkielgts nyelvn a vltozk a csatlakozsok, a vltozk rtkei
a csatlakozsok cmkzse, a knyszer pedig az, hogy minden vonalnak csak egy cmkje van. Br a trideres
vonalcmkzsi problma NP-teljes, a kznsges knyszerkielgtsi algoritmusok a gyakorlatban jl
mkdnek.
5. Objektumok felismerse
A lts lehetv teszi szmunkra, hogy megbzhatan felismerjnk embereket, llatokat s lettelen dolgokat.
Az MI-ben, illetve a szmtgpes ltsban az objektumfelismers fogalmt szoks szerint mindezen dolgokra
alkalmazzk. Ez magban foglalja a kpen rgztett objektumok osztlynak felismerst pldul: ez egy arc,
illetve adott objektumok felismerst is pldul: ez Bill Clinton arca. A motivcit ilyen alkalmazsi terletek
jelentik:
Biometrikus azonosts (biometric identification): a bngyi vizsglatok s a vdett ltestmnyek
belpsszablyozsa megkveteli az egynek azonostst. Az ujjlenyomatok, az riszlenyomat s az arckpek
olyan kpeket eredmnyeznek, amelyeket adott egynekhez kell rendelni.
780
Created by XMLmind XSL-FO Converter.
Az szlels
Tartalomalap kpkeress (content-based image retrieval): knny egy dokumentumban megtallni azt a
helyet ha ltezik , ahol a macska sz szerepel. Brmelyik szvegszerkeszt kpes erre. Most gondoljon
arra a feladatra, hogy egy kpen megtallja a kppontok azon rszhalmazt, amely egy macska kpnek felel
meg. Ha valaki rendelkezne ezzel a kpessggel, akkor megvlaszolhatna olyan keresseket, mint pldul
Bill Clinton s Nelson Mandela egytt, egy grkoris a levegben, az Eiffel-torony jszaka stb., anlkl
hogy egy gyjtemny minden egyes fnykphez feliratkulcsszavakat kellett volna rendelnnk. Ahogy a kps videogyjtemny nvekszik, a kzi feliratozs lehetetlenn vlik.
Kzrs-felismers (handwriting recognition): pldul az alrsok, bortkok cmmezi, csekkeken
szerepl sszegek s a kziszmtgpek tollalap beviteli megoldsa.
A ltst nemcsak objektumok, hanem cselekvsek felismersre is hasznljuk. Felismerhetnk jrsmdokat
(egy bart jrst), kifejezseket (egy mosolyt, egy grimaszt), gesztikulcit (egy integet embert),
cselekvseket (ugrst, tncot) s gy tovbb. A cselekvsfelismerst clz kutats mg gyerekcipben jr, gy
ebben az alfejezetben az objektumfelismersre koncentrlunk.
A vizulis objektumok felismersnek feladata ltalban knny az emberek szmra, de a szmtgpek
szmra igen nehznek bizonyult. Fel akarjuk ismerni egy ember arct fggetlenl a megvilgts, a kamerhoz
kpesti helyzet s az arckifejezs klnbz variciitl. Ezen varicik brmelyike szles kr vltozsokat
eredmnyez a kppontok fnyessgrtkeiben, gy a kppontok kzvetlen sszehasonltsa valsznleg nem
fog mkdni. Ha valaki egy kategria (pldul az aut) pldnyait szeretn felismerni, akkor a kategrin
belli varicikat is figyelembe kell vennie. Mg a postai irnytszmoknl a kzzel rt szmjegyek
felismersnek igen korltozott feladata is komoly kihvsnak bizonyult.
A felgyelt tanuls vagy a mintaosztlyozs termszetes keretet biztost az objektumfelismers
tanulmnyozshoz. Pozitv (arcok) s negatv pldaknt (nem arcok) adott kpek esetben a cl egy olyan
fggvny megtanulsa, amely az j kpeket felcmkzi az arc s a nem arc jellsekkel. A 18. s 20. fejezet
sszes technikja lehetsges jellt a feladatra: tbbrteg perceptronokat, dntsi fkat, legkzelebbi-szomszd
osztlyozkat s kernelgpeket alkalmaztak mr objektumfelismersi feladatokra. Meg kell azonban
jegyeznnk, hogy ezen technikk alkalmazsa objektumok felismersre tvolrl sem egyrtelm.
Az els kihvs a kp szegmentlsa. Minden kp tipikusan tbb objektumot fog tartalmazni, gy elszr olyan
kppontrszhalmazokra kell osztanunk, amelyek egy-egy objektumnak felelnek meg. Miutn a kpet rgikra
osztottuk, utna a rgikat vagy az azokbl sszelltott egysgeket tadjuk egy osztlyoznak, hogy
meghatrozza az objektumok cmkit. Sajnlatos mdon a lentrl felfel szegmentci hibkra rzkeny eljrs,
ezrt alternatv megoldsknt knlkozik a fentrl lefel objektumcsoport meghatrozsa. Eszerint keresni kell
egy kppontrszhalmazt, amit arcknt lehet osztlyozni, s ha ez sikerlt, mris van egy csoportunk! A tisztn
fentrl lefel mdszerek nagyon szmtsignyesek, mivel klnbz mret kpablakokat kell megvizsglni
klnbz helyszneken, s az sszes klnbz objektumhipotzissel ssze kell vetni ket. Jelenleg a
leginkbb gyakorlati objektumfelismer rendszerek ilyen fentrl lefel stratgit alkalmaznak, br ez
megvltozhat, ahogy a lentrl felfel technikk fejldnek.
A msodik kihvs annak biztostsa, hogy a felismers folyamata kellen robusztus a megvilgts s az
elhelyezkeds vltozsaira. Az emberek fel tudnak ismerni objektumokat a kppontok fnyessgrtkeivel mrt
pontos megjelens jelents vltozsai ellenre is. Pldul egy bart arct klnbz fnyviszonyok mellett vagy
klnbz ltszgekbl is felismerjk. Egy ennl is egyszerbb pldaknt megvizsglhatjuk a kzzel rt 6-os
szmjegy felismerst. Kpesnek kell lenni a 6-os felismersre klnbz mretekben, a kp klnbz
pozciiban s a kp kisebb elforgatsai ellenre is.4
A kulcsmomentum azt szrevenni, hogy a geometriai transzformcik, mint pldul az elfordts, a mretvlts
s a forgats, vagy a kp fnyessgnek megvltozsai a fnyforrsok fizikai mozgatsa ltal, ms jellemzkkel
rendelkeznek, mint a kategrin belli varicik, mint pldul az emberek arcainak klnbzsgei.
Nyilvnval, hogy a tanuls az egyetlen md az emberi arcok klnbzsgeinek megtanulsra vagy a 4-es
szmjegy klnbz rsmdjainak felismersre. Msrszrl a geometriai s fizikai transzformcik hatsai
szisztematikusak s kikszblhetk a tanul mintk paramtereit ler tulajdonsgok megfelel tervezsvel.
Annak rdekben, hogy a geometriai transzformcikra vonatkoz invariancit biztostsuk, egy egszen
hatkonynak bizonyult eljrs a kp rgijnak elfeldolgozsa gy, hogy standard pozciba, mretre s
orientcira alaktjuk. Egy alternatv megolds az, ha egyszeren figyelmen kvl hagyjuk a geometriai s
4
A teljes elforgatsinvariancia nem szksges s nem is kvnatos ekkor a 9-es s a 6-os sszekeverhet lenne!
781
Created by XMLmind XSL-FO Converter.
Az szlels
fizikai transzformcik alkalmi termszett, s gy gondolunk rjuk, mint az osztlyoz varilhatsgnak egy
jabb forrsra. A tant mintk halmazban az sszes ilyen varicira pldkat kell elhelyeznnk, s abban
remnykednk, hogy az osztlyoz kikvetkeztet egy megfelel transzformcihalmazt a bemenetre, s gy
kiszri a varicikat.
Vizsgljunk meg most az objektumfelismersre szolgl specilis algoritmusokat! Az egyszersg rdekben
ktdimenzis sszelltsban fogjuk a problmt vizsglni, ahol mind a tanul, mind a tesztmintk ktdimenzis
fnyessgbrk formjban adottak. Olyan terleteken, mint pldul a kzrs-felismers, ez nyilvnvalan
elegend. Mg hromdimenzis objektumok esetben is hatkony stratgia az objektumokat tbb ktdimenzis
nzettel reprezentlni (lsd 24.18. bra), s az j objektumokat a (valamilyen reprezentcij) trolt nzetekkel
sszehasonltva osztlyozni.
Az elz alfejezet megmutatta, hogy tbb tnyez vesz rszt a hromdimenzis informci kinyersben egy
jelenetbl. Az objektumfelismers is tbb tnyezn alapszik egy tigrist a narancs s fekete sznek
keveredsrl, cskos mintzatrl s testnek alakjrl ismernk fel.
A szn s a mintzat hisztogramok vagy empirikus frekvenciaeloszlsok segtsgvel reprezentlhat. Ha adott
egy tigris kpe mintaknt, akkor megmrhetjk a klnbz szn kppontok arnyt. Ezutn, ha egy ismeretlen
pldt ltunk, sszevethetjk a szn hisztogramjt a korbbi tigrispldknl ltottakkal. A mintzatok
elemzshez a kp klnbz irny s sklzs szrkkel trtnt konvolcija utn kapott eredmnyeinek
hisztogramjait vizsgljuk, egyezst keresve.
Az alak felhasznlsa az objektumfelismersben sokkal bonyolultabbnak bizonyult. Nagyjbl kt irnyzatot
klnbztethetnk meg: fnyessgalap felismerst (brightness-based recognition), ahol a kppontok
fnyessgrtkeit direkt mdon hasznljuk, s jellemzalap felismerst (feature-based recognition), ahol
kiemelt jellemzk, mint pldul az lek vagy a kulcspontok rszleges elrendezst hasznljuk. Miutn
rszletesebben megvizsgltuk e kt megkzeltst, trgyalni fogjuk a pozcibecslst (pose estimation), azaz az
objektum helyzett s irnyt a jelenetben.
782
Created by XMLmind XSL-FO Converter.
Az szlels
vonal- s lszrk ltal ellltott jellemzket hasznl dntsi fkat s wavelet-jellemzket hasznl, naiv
Bayes-modelleket. Az utbbi mdszer nhny eredmnye a 24.19. brn lthat.
A feldolgozatlan kppontok jellemz vektorknt trtn hasznlatnak egy negatv aspektusa az ebben a
reprezentciban rejl hatalmas redundancia. Vegynk pldul kt egyms melletti kppontot az arc pofa
rszn; valsznleg igen ers kzttk a korrelci, hiszen hasonl a geometrijuk, megvilgtsuk stb. Az
adatmennyisget cskkent technikk, mint pldul a fkomponens-analzis, sikeresen hasznlhatk a
jellemzvektor dimenziszmnak cskkentsre, lehetv tve az olyan dolgok, mint pldul arcok,
nagydimenzis terekben val felismersnl nagyobb sebessg felismerst.
Az szlels
Form [DArcy Thompson, 1917]) megfigyelte, hogy a hasonl, de nem azonos alakzatok gyakran egybeessbe
hozhatk egyszer koordinta-transzformcikkal.5 E mdszer szerint az alakzatok hasonlsgt egy hrom
lpsbl ll folyamattal hatrozzuk meg: (1) megoldjuk a kt alakzat megfeleltetsi problmjt, (2) a
megfeleltetst felhasznljuk egy egymsra illesztsi transzformci megbecslsre, s (3) kiszmtjuk a kt
alakzat kztti tvolsgot az egymsnak megfelel pontok illeszkedsi hibinak sszegeknt, kiegsztve a
fedsbe hoz transzformci nagysgval.
Az alakzatot a bels vagy kls krvonalt alkot pontok diszkrt halmazaknt reprezentljuk. Ezeket
elllthatjuk egy ldetektl ltal megtallt lkppontok helye alapjn, gy kapunk egy N pontbl ll {p1,,
pN} halmazt. A 24.20. (a) s (b) bra kt alakzat mintapontjait mutatja.
Most tekintsnk egy pi mintapontra s az onnan indul sszes tbbi mintapontra mutat vektorra egy alakzaton.
Ezek a vektorok kifejezik a teljes alakzat konfigurcijt a referenciaponthoz viszonytva. Ez a kvetkez
tlethez vezet: rendeljnk minden mintaponthoz egy lert, az alakzatkontextust (shape context), amely
megadja az alakzat tovbbi rsznek durva elrendezst az adott ponthoz viszonytva. Pontosabban fogalmazva
a pi alakzatkontextusa a maradk N 1 pk pontra a pk pi relatv koordintk egy kzelt hi trbeli hisztogramja.
Egy logaritmikus polris koordinta-rendszert hasznlunk a tartk meghatrozsra annak biztostsa rdekben,
hogy a ler rzkenyebb legyen a kzeli kppontok esetben. A 24.20. (c) bra mutat erre egy pldt.
Vegyk szre, hogy az alakzat kontextusnak defincija magban hordozza az elforgatsinvariancit, hiszen
minden mrst az objektum pontjaihoz kpest vgznk. A mretinvariancia elrshez minden sugrirny
tvolsgot normalizlunk a pontprok kztti tlagos tvolsggal.
Az alakzatkontextus lehetv teszi, hogy a megfeleltetsi problmt megoldjuk kt hasonl, de nem azonos
objektumra, mint ahogy az a 24.20. (a) s (b) brn ltszik. Az alakzatkontextus klnbz lesz egy S alakzat
klnbz pontjaira, de egy S s egy S' alakzat megfelel (homolg) pontjainak alakzatkontextusa hajlamos lesz
a hasonlsgra. Ezek utn a kt alakzat megfeleltethet pontjai megtallsnak problmjt akknt kezelhetjk,
mint hasonl alakzatkontextussal rendelkez prok megtallst.
784
Created by XMLmind XSL-FO Converter.
Az szlels
Preczebben fogalmazva: tekintsk a pi pontot az els, a qj pontot a msodik alakzaton. Jellje a Cij = C(pi,qi) a
kt pont illesztsnek kltsgt. Minthogy az alakzatkontextusok hisztogramokkal reprezentlt eloszlsok, gy
termszetes a 2 tvolsg hasznlata:
ahol hi(k) s hj(k) a normalizlt hisztogram k-adik rtkt jelli a pi, illetve a qj pontokban. Ha adott az els
objektum i s a msodik objektum j pontjainak sszes lehetsges prostsra a Cij kltsgek halmaza, akkor az
illeszts teljes kltsgt akarjuk minimalizlni azzal a knyszerfelttellel, hogy az illeszkedsnek klcsnsen
megfelelnek kell lennie. Ez egy plda a slyozott pros illeszts (weighted bipartite matching)
problmjra, amely O(N3) idben megoldhat a magyar algoritmussal.
A mintapontok megfeleltetse alapjn a teljes alakzatra kiterjeszthet a megfeleltets annak a fedsi
transzformcinak a megbecslsvel, amely az egyik alakzatot a msikra kpezi le. A regularizlt vkonylemez
spline-ok (thin plate spline) klnsen hatkonyak. Ha az alakzatokat fedsbe hoztuk, a hasonlsgi mrtkek
kiszmtsa viszonylag kzenfekv. A kt alakzat kztti tvolsg definilhat az egymsnak megfelel pontok
alakzatkontextus-tvolsgainak s a vkonylemez spline-hoz rendelt ktsi energinak a slyozott sszegeknt.
Ezt a tvolsgmrtket meghatrozva egy egyszer legkzelebbi-szomszd osztlyoz megoldja a felismersi
problmt. A 20. fejezetben rtuk le ezen mdszer kitn teljestmnyt a kzzel rt szmjegyek
osztlyozsban.
Az szlels
Az objektumot M jellemzvel, avagy m1, m2, , mM hromdimenzis ponttal reprezentljuk pldul egy
soklap objektum sarokpontjaival. Ezeket valamilyen, az objektumnak termszetes koordinta-rendszerben
hatrozzuk meg. Ezek utn a pontokat egy ismeretlen hromdimenzis forgatsnak, R-nek vetjk al, amit egy
ismeretlen t mrtk eltols kvet, vgezetl egy vetts kvetkezik, amivel elllnak a kpsk {p1, p2, pN}
jellemzi. ltalban N M, mivel bizonyos modellpontokat elnyelhettek, s a jellemzdetektor kihagyhat egyes
jellemzket (vagy hamisakat hatrozhat meg a zaj miatt). Ezt egy hromdimenzis mi modellpontra s a neki
megfelel pi kppontra a kvetkezkppen fejezhetjk ki:
Itt az R a rotcis mtrix, t az eltols, s jelli a perspektivikus vettst vagy annak egy kzeltst, mint
pldul a sklzott ortografikus vettst. A vgs eredmny a Q transzformci, ami az mi modellpontot
megfelelteti a pi kppontnak. Br kezdetben nem ismerjk a Q transzformcit, (merev objektumokra) tudjuk,
hogy Q-nak minden modellpontra azonosnak kell lennie.
Meghatrozhatjuk Q-t a modellpontjainak s a pontoknak megfelel ktdimenzis projekcik adott
hromdimenzis koordinti alapjn. Intucink a kvetkezt sgja: felrhatunk olyan egyenleteket, amelyek az
mi modellpontokat s a pi kppontokat szszekapcsoljk. Ezekben az egyenletekben az ismeretlen mennyisgek
az R forgatsi mtrix s a t eltolsi vektor paramtereinek felelnek meg. Ha van elg egyenletnk, ki kell
tudnunk szmolni Q-t. Nem fogjuk bizonytani itt, hanem csupn lltjuk a kvetkez eredmnyt:
Ha adott hrom, nem egy egyenesre es m1, m2 s m3 modellpont, s ezek sklzott ortogonlis projekcija, p1, p2
s p3 a kpskon, akkor ltezik pontosan kt transzformci a hromdimenzis modell koordintakeretbl a
ktdimenzis kpkoordinta-keretbe.
Ezek a transzformcik a kpskra vonatkoz tkrzsen keresztl kapcsolatban llnak egymssal, s egy
egyszer zrtalak megoldssal meghatrozhatk. Ha meg tudnnk hatrozni a kp hrom jellemzjnek
megfelel hrom modelljellemzt, akkor kiszmolhatnnk Q-t, az objektum helyzett. Az elz alfejezetben
trgyaltunk egy alakzatkontextuson alapul megfeleltetst. Ha az objektumnak vannak jl meghatrozott sarkai
vagy ms jellegzetes pontjai, akkor egy mg egyszerbb technika alkalmazsa vlik lehetsgess. Az tlet
lnyege a generls s tesztels. Egy kezdeti megfeleltetst kell tallnunk egy kphrmas s egy modellhrmas
kztt, majd a TRANSZFORMCITKERES eljrst hasznljuk Q egy hipotzisnek ellltsra. Ha a tippelt
megfelels helyes volt, akkor Q helyes lesz, s ha a tbbi modellpontra alkalmazzuk, a kppontok predikcijt
eredmnyezi. Ha a tippelt megfelels helytelen volt, akkor Q helytelen lesz, s ha a maradk modellpontokra
alkalmazzuk, nem lltja el a kppontokat.
Ez a 24.21. brn lthat ILLESZTS algoritmus alapja. Az algoritmus megtallja egy adott modell
elhelyezkedst, vagy hibval tr vissza. Az algoritmus idbeli komplexitsa a legrosszabb esetben arnyos a
modell- s kpponthrmasok kombinciinak szmval, vagyis
-mal, megszorozva minden egyes
kombinci ellenrzsnek kltsgvel. Az ellenrzs kltsge M logN, mivel az M modellpont mindegyikre
el kell lltanunk a kpbeli pozcit, s meg kell tallnunk a legkzelebbi kpponttl mrt tvolsgot, ami egy
log N mvelet, ha a kp pontjai egy megfelel adatstruktrban helyezkednek el. gy legrosszabb esetben az
algoritmus idbeli komplexitsa O(M4N3 logN), ahol M s N a modell s a kp pontjainak szma. Az
786
Created by XMLmind XSL-FO Converter.
Az szlels
24.22. bra - (a) A tzgp fnykpn tallt sarkok. (b) Az eredeti kpre rhelyezett
hipotetikus rekonstrukci (Clark Olson hozzjrulsval).
787
Created by XMLmind XSL-FO Converter.
Az szlels
Fontos
788
Created by XMLmind XSL-FO Converter.
Az szlels
A gpkocsi-vezetsi plda egy szempontot igencsak vilgoss tesz: egy konkrt feladat esetn a kpen
elvben tallhat sszes informci kinyerse nem szksges. Nem szksges a gpkocsik pontos
alakjnak a meghatrozsa, az ttal szomszdos fves terletekre vonatkoz az-alak-a-textrbl
problma megoldsa stb. A feladat informciszksglete csak egy bizonyos tpus informcira
vonatkozik, s lnyeges szmtsi sebessget s robusztussgot lehet biztostani, ha csak erre az
informcira sszpontostunk, s a problmbl add knyszereket teljes egszben kihasznljuk. Az
elbbi rszekben bemutatott ltalnos megkzeltsek clja az volt, hogy egy ltalnos alapelmletet
adhassunk, amit majd a konkrt feladat szksgleteihez lehet specializlni.
7. sszefoglals
Br az ember szmra az rzkels knnyed cselekvsnek tnik, igen nagy mennyisg komplex szmtst
ignyel. A lts clja informci kiemelse olyan feladatokhoz, mint a manipulls, a navigls s az
objektumfelismers.
A kpalkots (image formation) folyamata, a geometriai s fizikai aspektusokat tekintve, jl feltrt terlet.
Ha adott egy hromdimenzis jelenet lersa, ennek valamilyen tetszleges kamerapozcinak megfelel
kpt knnyszerrel elllthatjuk (grafikai problma). E folyamat megfordtsa s a jelenet lersnak a kp
alapjn trtn ellltsa nehz.
Ahhoz, hogy a manipullsi, naviglsi s objektumfelismersi feladatokhoz szksges vizulis informcit
kiemelhessk, szksg van valamilyen kzbls reprezentci megkonstrulsra. A kpekbl az olyan
primitv elemeket, mint az lek s a rgik, a kpfeldolgozsi algoritmusok (image-processings) emelik ki.
Egy kpben tbbfle segtsg rejlik, amely lehetv teszi, hogy a jelenetrl hromdimenzis informcit
kapjunk. Idetartozik a mozgs, a sztereolts, a textra, az rnyals s a kontrelemzs. Ezek mindegyike a
fizikai jelenetre vonatkoz httr- felttelezseken alapul, hogy az interpretcit kzel egyrtelmv tegye.
A teljes kr objektumfelismers nagyon nehz problma. A fnyessg- s a jellemzalap megkzeltseket
trgyaltuk. Ms lehetsgek is vannak.
789
Created by XMLmind XSL-FO Converter.
Az szlels
Maxwell s Helmholtz munkja megalaptotta a sznes lts hrom sznen alapul elmlett. Azt a tnyt, hogy
az emberi szem a mlysg rzkelsre is kpes, ha a kt szem kiss eltr kpet lt, Wheatstone a sztereoszkp
feltallsval demonstrlta (Wheatstone, 1838). A kszlknek azonnal nagy sikere lett a szalonokban Eurpaszerte. A ktkamers sztereolts lnyegt, azaz hogy a jelenet kt, kiss eltr ltszgbl ksztett kpe
elegend informcit hordoz a jelenet hromdimenzis visszalltshoz, a fotogrammetria terletn aknztk
ki. Megszlettek a kulcsfontossg matematikai eredmnyek. Kruppa bebizonytotta, hogy ha t klnbz pont
kt klnbz kpvel rendelkeznk, vissza lehet lltani a kt kamera pozcija kztti elfordulst s eltolst,
valamint a jelenet mlysgt (egy sklafaktor erejig) (Kruppa, 1913). Br a sztereolts geometrijt j ideje
ismertk, a fotogrammetria megfeleltetsi problmjt ltalban emberek oldottk meg, akik az egymsnak
megfelel pontokat igyekeztk egymshoz illeszteni. Az embereknek a megfeleltetsi problma megoldsban
megmutatkoz csodlatos kpessgt Julesz Bla demonstrlta a vletlen-pont sztereogram feltallsval
(Julesz, 1971). Ezen problma megoldsra mind a szmtgpes lts terletn, mind a fotogrammetriban sok
munkt fordtottak az 1970-es s az 1980-as vekben.
A 19. szzad msodik fele volt az a peridus, amikor az emberi ltsra vonatkoz pszichofizikai kutatsokat
megalapoztk. A 20. szzad els felben a lts terletn a legfontosabb eredmnyekhez a Max Wertheimer
vezette Gestalt pszicholgiai iskola jutott. Az egsz tbb, mint a rszek sszege jelszval azt a nzetet
hangslyoztk, hogy az szlels elsdleges elemei a teljes formk legyenek, ne pedig az sszetevk, mint
pldul az lek.
A msodik vilghbor utni szakaszt megjult aktivits jellemezte. A legfontosabb J. J. Gibson munkja volt,
aki rmutatott az optikai folyam s a textragradiensek fontossgra olyan krnyezeti vltozk becslsnl, mint
a dls s a lejts (Gibson, 1950; 1979). jbl hangslyozta az ingerek fontossgt s gazdagsgt. Gibson,
Olum s Rosenblatt rmutattak, hogy az optikai folyammez elegend informcit tartalmaz ahhoz, hogy a
megfigyel meghatrozhassa sajt mozgst a krnyezetben (Gibson s trsai, 1955). A szmtgpes ltsban a
kutats ezen terleten s a (matematikailag ekvivalens) struktra-a-mozgsbl terleten fleg az 1980-as
vekben ment vgbe, Koenderink, Van Doorn, Ullman s Longuet-Higgins alapoz eredmnyeit kvetve
(Koendrink s Van Doorn, 1975; Ullman, 1979; Longeut-Higgins, 1981) adott lendletet e tevkenysgnek. A
kezdeti aggodalmakat a mozgsbl szrmaztatott struktra stabilitsval kapcsolatban Tomasi s Kanade
munkja (Tomasi s Kanade, 1992) csillaptotta, akik megmutattk, hogy tbb kpkocka felhasznlsval s az
ebbl szrmaz szles alapvonallal az alak egszen pontosan felismerhet.
Chan s trsai rjk le a lgy meghkkent vizulis appartust, amelynek tzszer nagyobb az idbeli vizulis
aktivitsa, mint az emberek (Chan s trsai, 1998). Azaz egy lgy egy maximum 300 kpkocka/msodperc
sebessg filmet is gy tudna nzni, hogy felismeri az egyes kpkockkat.
Az 1990-es vekben megjelent koncepcionlis jts a mozgsbl szrmaztatott struktra tanulmnyozsa volt.
Egy ilyen belltsban a kamera kalibrcija nem szksges, ahogy azt Faugeras megmutatta (Faugeras, 1992).
Ez a felfedezs sszefgg az objektumfelismersben alkalmazott geometriai invarinsokkal, ahogy azt Mundy
s Zisserman ttekintettk (Mundy s Zisserman, 1992), s a mozgsbl szrmaztatott rokon struktrval
(Koenderink s Van Doorn, 1991). Az 1990-es vekben a szmtgpek sebessgnek s trolsi kapacitsnak
nvekedsvel a digitlis videofelvtelekbl trtn mozgsi szekvenciaelemzst sok j terleten alkalmaztk.
Valsvilg-beli jelenetek geometriai modelljeinek felptse a szmtgpes grafikai technikkkal trtn
elllts cljbl klnsen npszernek bizonyult, amelyet olyan rekonstrukcis algoritmusok vezettek, mint
amelyet pldul Debevec, Taylor s Malik fejlesztettek ki (Debevec, Taylor s Malik, 1996). Hartley s
Zisserman, valamint Faugeras s trsainak knyvei tfogan trgyaljk a tbbszrs nzetek geometrijt
(Hartley s Zisserman, 2000; Faugeras s trsai, 2001).
A szmtgpes ltsban az alak textrbl val kinyersre vonatkoz legfontosabb kezdeti eredmnyeket
Bajcsynak, Liebermannak s Stevensnek ksznhetjk (Bajcsy s Lieberman, 1976; Stevens, 1981). Mg ez a
munka sk felletekre vonatkozott, a grblt felletekre vonatkozan tfog elemzseket Garding, Malik s
Rosenholtz vgeztek (Garding, 1992; Malik s Rosenholtz, 1994).
A szmtgpes ltsban az alaknak az rnykolsbl val kinyerst Berthold Horn tanulmnyozta (Horn,
1970). E terlet f cikkeit a (Horn s Brooks, 1989) tekinti t. Ez a megkzelts szmos egyszerst felttellel
lt, amelyekbl a legknyesebb a klcsns megvilgts hatsnak figyelmen kvli hagysa volt. A klcsns
megvilgts fontossgt kellen rtkeltk a szmtgpes grafika terletn, ahol ppen ezen hats
figyelembevtelre fejlesztettk ki a fnysugrkvetst s a radiozitst. Egy elmleti s gyakorlati kritika a
(Forsyth s Zisserman, 1991)-ben tallhat.
790
Created by XMLmind XSL-FO Converter.
Az szlels
7.2. Feladatok
24.1.
A sr, lombos koronval rendelkez fa rnykban szmos vilgos foltot lehet ltni. Meglepetsre mind
krkrs. Mirt? Hiszen ha gy vesszk, a levelek kztti rsek, amelyeken keresztl tvilgt a nap, nagy
esllyel nem ilyenek.
24.2.
Cmkzze meg a 24.24. brn lthat objektumot, azt felttelezve, hogy a kls leket takar leknek
cmkztk, s az sszes sarokpont trideres. Tegye meg ezt a visszalp algoritmussal, amely a sarokpontokat A,
B, C s D sorrendben fogja megvizsglni, mindegyik lpsnl gy megvlasztva a cmkket, hogy azok az elbb
megcmkzett csatlakozsokkal s lekkel konzisztensek legyenek. Prblja most a sarokpontokat B, D, A s C
sorrendben megcmkzni.
791
Created by XMLmind XSL-FO Converter.
Az szlels
24.3.
Tekintsen egy vgtelen hossz, r sugar hengert, amelynek tengelye az y tengellyel prhuzamos. A henger
Lambert-fle fellettel rendelkezik, s a pozitv z tengely fell irnytjuk r a kamert. Mit fog ltni a kpen, ha
a hengert egy pontszer fnyforrs vilgtja meg, amely a pozitv x tengelyen a vgtelenben helyezkedik el.
Magyarzza meg a vlaszt gy, hogy az azonos fnyessg kontrokat rajzolja fel a vettett kpre. Az azonos
fnyessg kontrok azonos tvolsgban helyezkednek-e el?
24.4.
A kpbeli lek a jelenetesemnyek sokasgnak felelhetnek meg. Tekintsen egy tetszleges fnykpet, amely
valdi hromdimenzis jelenetet brzol. Azonostson a kpen tz lt, s ksrelje meg egyenknt eldnteni,
hogy az l (a) a mlysg, (b) a felleti normlis, (c) a reflektancia, illetve (d) a megvilgts szakadsnak felele meg.
24.5.
Mutassa meg, hogy a konvolci egy adott fggvnnyel felcserlhet a differencilssal, azaz, hogy:
(f g') = f g'
24.6.
792
Created by XMLmind XSL-FO Converter.
Az szlels
Egy terlet feltrkpezshez egy sztereorendszer hasznlatt fontolgatjuk. A rendszer kt CCD kamerbl fog
llni, mindegyik 512 512 pixel felbonts egy 10 10 cm ngyzet alak rzkeln. A felhasznland lencsk
fkusztvolsga 16 cm, s a lencsk a vgtelenben fixlnak. A bal oldali kp (u1, v1) s a jobb oldali kp (u2, v2)
egymshoz tartoz pontjaira v1 = v2, hiszen a kt kpskon az x tengelyek az epipolris vonalakkal
prhuzamosak. A kt kamera optikai tengelye prhuzamos. A kt kamera kztti bzisvonal 1 m.
a. Ha a legkzelebbi mrend tv 16 m, mi a tapasztalhat legnagyobb diszparits (kppontban)?
b. Mi a tvmrs pixelfelbontsbl add felbontsa 16 m tvolsgban?
c. Milyen tv tartozik az egy kppontos kpeltrshez?
24.7.
Az illesztsi algoritmust egy ipari alkalmazsnl szeretnnk hasznlni, ahol lapos alkatrszeket egy
szlltszalag visz, a szalag felett pedig egy fgglegesen elhelyezett kamera figyel. Az alkatrsz
elhelyezkedst hrom vltoz hatrozza meg, egy az elfordulst s kett az alkatrsz ktdimenzis pozcijt.
Ez egyszersti a problmt, s a TRANSZFORMCIT-KERES fggvny az egymsnak megfelel kp- s
modelltulajdonsgokbl kt prt ignyel ahhoz, hogy az elhelyezkedst azonostsa. Hatrozza meg csak ebben a
krnyezetben az illesztsnek a legrosszabb esetre vett komplexitst.
24.8.
(Pietro Perona nyomn.) A 24.25. bra X s Y pontban kt kamert mutat, amelyek megfigyelnek egy jelenetet.
Rajzolja le azt a kpet, amit az egyes kamerk ltnak (felteheti, hogy minden jellt pont ugyanabban a vzszintes
skban helyezkedik el). Mi tudhat meg a kt kp alapjn az A, B, C, D s E pontok a kamera alapvonaltl mrt
relatv tvolsgrl, s milyen alapon?
24.25. bra - Fellnzeti kp egy ktkamers ltrendszerrl, amely egy veget figyel
meg, amely mgtt egy fal van
24.9.
A kvetkez lltsok kzl melyik igaz s melyik hamis?
a. Sztereokpeken az egymsnak megfelel pontok megtallsa a sztereomlysg-megllapts folyamatnak
legegyszerbb feladata.
b. Az alak-mintzatbl feladat megoldhat egy fnycskokat tartalmaz hl jelenetre trtn vettsvel.
793
Created by XMLmind XSL-FO Converter.
Az szlels
794
Created by XMLmind XSL-FO Converter.
1. Bevezets
A robotok (robots) olyan fizikai gensek, amelyek a fizikai vilg megvltoztatsval oldanak meg feladatokat.
E clbl klnbz beavatkoz szervekkel (effectors) szerelik fel ket, pldul lbakkal, kerekekkel, karokkal
s megfogkkal. A beavatkozk kizrlagos clja, hogy fizikai hatst fejtsenek ki a krnyezetre. 1 A robotokat
rzkelkkel (sensors) is felszerelik, hogy rzkelhessk krnyezetket. Manapsg a robotikban szmtalan
klnfle rzkelt hasznlnak: kamerkat s ultrahangradarokat a krnyezet mrsre, giroszkpokat s
gyorsulsmrket a robot sajt mozgsnak kvetsre.
A legtbb mai robot hrom nagy kategria egyikbe sorolhat. A manipultorok (manipulators), vagy ms
nven robotkarok fizikailag a munka helysznhez rgztettek, pldul egy ipari szerelsoron egy gyrban vagy
a Nemzetkzi rllomson. A manipultorok mozgst ltalban irnythat csuklk sora biztostja, lehetv
tve, hogy a vgbeavatkoz szerv a munkatr brmely pontjra eljuthasson. Az ipari robotok messze
leggyakoribb fajtja a manipultor, vilgszerte tbb mint egymilli mkdik bellk. Bizonyos mobil
robotkarokat krhzakban, mtteknl hasznlnak. Kevs autgyrt tudna ma mr meglenni ipari robotok
nlkl, s egyes robotkarok mg malkotsok ksztsre is kpesek.
A msodik csoportot a mobil robotok (mobile robots) alkotjk. A mobil robotok kerekek, lbak vagy hasonl
szerkezetek segtsgvel mozognak a fizikai krnyezetben. Hasznljk ket krhzakban telkihordsra,
dokkokban rurakodsra s ms, hasonl feladatokra. Korbban mr emltettnk egy pldt, a NAVLAB ember
nlkli kzti jrmvt (unmanned land vehicle, ULV), amely autplyn kpes nllan, sofr nlkl
naviglni. Msfajta mobil robotokat, pldul az ember nlkli lgi jrmveket (unmanned air vehicle, UAV)
katonai feldertsre, mezgazdasgi permetezsre s megfigyelsre hasznlnak. Az autonm vz alatti
jrmvek (autonomous underwater vehicle, AUV) nagy szerepet jtszanak a mlytengeri felfedezsekben,
mg a bolygjrk (planetary rovers), mint pldul a 25.1. (a) brn lthat Sojourner, az rkutatsban
segdkeznek.
25.1. bra - (a) A NASA Sojourner mobil robotja, amely a Mars felsznt dertette fel
1997 jliusban. (b) A Honda P3 s Asimo elnevezs humanoid robotjai.
A 2. fejezetben mg beavatkozkrl (actuators) beszltnk, s nem beavatkoz szervekrl (effectors). A beavatkoz egy vezrlvonal,
amely a beavatkoz szervnek kzvetti az utastst, mg a beavatkoz szerv maga a fizikai eszkz.
1
795
Created by XMLmind XSL-FO Converter.
Robotika
A harmadik tpusba tartoznak a hibridek: olyan mobil robotok, amelyekre karokat is szereltek. Ezek kz
sorolhatjuk a humanoid robotokat (humanoid robots), amelyek fizikai felptse hasonlt az emberhez. A
25.1. (b) brn kt ilyen humanoid robot lthat, mindkett Japnban kszlt, a Hondnl. A hibridek a rgztett
manipultoroknl nagyobb tvolsgokban is kpesek beavatkoz szerveiket hasznlni, de ltalban nehezebben
tudjk vgrehajtani a feladatukat, mert nem rendelkeznek kell stabilitssal s szilrdsggal, amit a lergzts
biztost.
A robotika trgykre magban foglalja a protziseket (emberek rszre ksztett mestersges vgtagok,
mestersges fl vagy szem), az intelligens krnyezeteket (mint pldul egy egsz hz felszerelve szenzorokkal
s beavatkoz szervekkel) s a tbbelem (multibody) rendszereket is, ahol a feladatokat rengeteg apr
egyttmkd robot hajtja vgre.
A valdi robotoknak ltalban olyan krnyezetben kell boldogulniuk, amely csak rszlegesen megfigyelhet,
sztochasztikus, dinamikus s folytonos. Nhny, de nem mindegyik robotkrnyezet szekvencilis s multigens
jelleg is. A rszleges megfigyelhetsg s a sztochasztikussg annak az eredmnye, hogy egy meglehetsen
nagy s komplex vilggal kell foglalkozni. A robot nem lt a sarkok mg, s bizonytalansg van a
mozgsparancsok vgrehajtsban a hajtsok csszsa, a srlds stb. miatt. Mi tbb, a fizikai vilg makacsul
visszautastja, hogy vals idejnl gyorsabb legyen! Szimulcis krnyezetben egyszerbb tanulsi
algoritmusok hasznlatval (mint pldul a 21. fejezetben lert Q-tanuls) lehetsges mindssze nhny CPUmunkara sorn tbb milli prbt vgrehajtva tanulni, de vals krnyezetben veket vehetnek ignybe ezek a
ksrletek. Tovbb, az igazi tkzsek valban fjdalmat okozhatnak, ellenttben a szimulltakkal. A valdi
robotrendszerekbe ahhoz, hogy a robot gyorsan tanulhasson s biztonsgosan zemelhessen elzetesen
informcit kell bepteni magrl a robotrl, fizikai krnyezetrl s az elvgzend feladatrl.
2. Robothardver
Eddig a knyvben adottnak tekintettk az gensek architektrjt (rzkelket, beavatkoz szerveket s
processzorokat), s csak az gensek mkdtet programjra koncentrltunk. A valsgban a robotok sikere
legalbb annyira mlik a feladathoz ill, megfelel szenzorok s beavatkoz szervek megvlasztsn.
2.1. rzkelk
A szenzorok jelentik az rzkelsi interfszt a robotok s krnyezetk kztt. A paszszv rzkelk (passive
sensors), mint pldul a kamerk, tnylegesen puszta megfigyeli a krnyezetknek: olyan jeleket vesznek,
amelyeket a robot krnyezetben lv ms trgyak generlnak. Az aktv szenzorok (active sensors), mint
pldul a hangloktor, energit sugroznak krnyezetkbe, s rzkelik, ha ez az energia visszaverdik. Az
aktv szenzorok ltalban tbb informcit szolgltatnak, de ugyanakkor tbbet fogyasztanak, s interferencia
lphet fel, ha egyszerre tbbet is hasznlunk. Akr aktv, akr passzv rzkelkrl van sz, hrom csoportba
lehet ket osztani az alapjn, hogy tvolsgot mrnek, teljes kpet kzvettenek a krnyezetrl vagy a robot
egyes sajt tulajdonsgait figyelik.
Sok mobil robot egy adott trrszt lefed psztz tvolsgmrt (range finder) hasznl, olyan szenzort,
amely a kzeli trgyak tvolsgt mri. Gyakori tpus a szonrszenzor, ms nven hangloktor. A
szonrszenzorok irnytott hanghullmokat bocstanak ki, amelyek egy rsze visszaverdik a trgyakrl. A
visszaverds ideje s a hullm intenzitsa informcival szolgl a kzeli trgyak helyzetrl. Az AUV-kre
(autonm vz alatti jrm) vz alatti hangloktorokat szerelnek. Szrazfldn a hangloktorokat rossz
irnyfelbontsuk miatt fleg kis tvolsgon belli tkzsek elkerlsre hasznljk. A hangloktorok
alternatvjt jelenthetik (elssorban lgi jrmveknl) a radaralap s a lzeres tvolsgmrk. Egy lzeres
psztz tvolsgmr lthat a 25.2. brn.
25.2. bra - (a) A mobil robotoknl npszer SICK LMS lzeres tvolsgmr. (b) Egy
horizontlisan felszerelt tvolsgmr ltal mrt visszaverdsi kp 2D-s trkpre
vettve.
796
Created by XMLmind XSL-FO Converter.
Robotika
Egyes tvolsgmrk csak nagyon kicsi vagy nagyon nagy tvolsgokra hasznlhatk. A kis tvolsg
szenzorok kz tartoznak a taktilis, vagyis tapintsalap rzkelk (tactile sensors), mint pldul az
rzkelbajusz, lkhrt vagy az rintsrzkeny br. A skla msik vgn a globlis helymeghatroz
rendszer (Global Positioning System, GPS) ll, amely a mholdakbl rkez impulzusok alapjn szmtja a
tvolsgot. Jelenleg kt tucat mhold kering orbitlis plyn, s mindegyik kt kln frekvencin sugroz
jeleket. A GPS-vevkszlkek a fzistolsbl tudjk kiszmtani a mholdtl val tvolsgukat. Tbb
mholdtl rkez jel alapjn hromszgelssel nhny mteres pontossggal meghatrozhat a Fldn elfoglalt
tnyleges pozci. A differencilis GPS (differential GPS) mg egy pontosan ismert helyen lv fldi vev
jelt is hasznlva idelis esetben millimteres pontossgot r el. Sajnlatos mdon a GPS nem hasznlhat
beltrben vagy vz alatt.
A szenzorok msik fontos osztlyt kpezik a kprzkelk (imaging sensors). A kamerk kpet adnak
szmunkra a krnyezetrl, valamint a 24. fejezetben trgyalt, szmtgpes gpi ltsi mdszerek
alkalmazsval modellekkel, illetve tulajdonsgokkal rjk le a krnyezetet. A sztereolts klnsen fontos a
robotikban, mivel mlysgi informcit is kzvett. Jvjk mindamellett elg bizonytalan, mert sikeresen
folyik j, aktv tvolsglekpezsi technolgik kidolgozsa.
A harmadik fontos osztlyt az nrzkelk (proprioceptive sensors) alkotjk, amelyek a robot sajt llapotrl
adnak tjkoztatst. Annak rdekben, hogy a robot csuklinak pontos llsrl informcink legyen, a motorok
tengelyt sokszor szghelyzet-dekdolkkal (shaft decoders) ltjk el, amelyek kis lpsekben kvetik a
tengely elfordulst. A robotkarokon a tengelyre szerelt dekdolk brmikor pontos helyzetinformcit tudnak
szolgltatni. Mobil robotokon a szghelyzet-dekdolkat a kerk mozgsnak figyelsre hasznljk, amely
alapjn szmthat a megtett t. Ezt hvjk odometrinak (odometry). Sajnlatos mdon az odometria a
kerekek csszsa s sodrdsa miatt csak kis tvolsgokban hasznlhat. A kls hatsok, mint pldul az
ramlsok az AUV-knl (autonm vz alatti jrm) vagy a szl az UAV-k (autonm lgi jrm) esetben tovbb
nveli a mrs bizonytalansgt. Az inerciaszenzorok (inertial sensors), mint pldul a giroszkp, javtanak a
pontossgon, de nmagukban mg nem kszblik ki a pozcimrs hibjnak elkerlhetetlen halmozdst.
A robotllapot ms fontos jellemzinek mrsre er- s nyomatkrzkelket (force, torque sensors)
hasznlnak. Ezek nlklzhetetlenek, ha a robotnak trkeny trggyal kell dolgoznia, vagy olyannal, amelynek
pontos mrete s helyzete nem ismert. Kpzeljk csak el, amikor egy kzel egytonns manipultornak egy
villanykrtt kell becsavarnia. Ha tl nagy ervel fogn meg a krtt, knnyen sszeroppanthatn. Az
errzkelk lehetv teszik, hogy a robot tudja, milyen nehz megfogni a krtt, mg a nyomatkrzkelk
informcit szolgltatnak, hogy milyen nehz becsavarni. A j szenzorok kpesek ert mrni mindhrom
elmozdulsi s mindhrom elfordulsi irnyban.
797
Created by XMLmind XSL-FO Converter.
Robotika
Szabadsgfoknak szmt minden olyan irny, amelyben a robot vagy egyik beavatkoz szerve mozogni kpes.
Pldul egy merev, szabadon mozg robotnak (mint amilyenek az AUV-k) hat szabadsgfoka van, hrom az (x,
y, z) trbeli elhelyezkeds, hrom pedig a szgelforduls (orientci). Ezeket szoktk csavarsnak, billentsnek
s forgatsnak is hvni (RPY roll, pitch, yaw). Ez a hat szabadsgfok meghatrozza a robot kinematikus
llapott,2 ms nven a pozcijt s az orientcijt egyttesen. A robot dinamikai llapota (dynamic state)
minden egyes kinematikai paramter vltozsi sebessgt is tartalmazza, gy minden kinematikai dimenzinl
egy-egy tovbbi dimenzit hoz be.
25.3. bra - (a) A Stanford manipultor: egy korai robotkar t rotcis (R) s egy
transzlcis (prizmatikus) csuklval (P), sszesen hat szabadsgfokkal. (b) Egy
elskerk-kormnyzs nemholonomikus ngykerek jrm mozgsa.
Nem merev testek esetben magn a roboton bell tovbbi szabadsgfokok vannak. Pldul az emberi kar
esetben a knyk egy szabadsgfok, mert egy irnyba kpes elfordulni. A csukl hrom szabadsgfok, mert
tud fel-le s jobbra-balra mozogni, tovbb forogni is. ltalban minden egyes robotcsuklnak is egy, kt vagy
hrom szabadsgfoka van. Hat szabadsgfok szksges ahhoz, hogy pldul egy kezet a trben tetszleges
pozciba s irnyba (orientciba) hozzunk. A 25.3. (a) brn lthat robotkarnak pontosan hat szabadsgi foka
van: t rotcis csukl (revolute joint), amelyek forgst tesznek lehetv, s egy transzlcis csukl
(prismatic joint), amely kinylsra kpes. Egy egyszer ksrlet segtsgvel knnyedn meggyzdhetnk
arrl, hogy az emberi kznek valjban hatnl tbb szabadsgfoka van: keznket az asztalra rakva mg mindig
kpesek vagyunk elforgatni a knyknket, anlkl hogy a keznk konfigurcija megvltozna. Azokat a
manipultorokat, amelyeknek tbb szabadsgfoka van, mint ami minimlisan szksges ahhoz, hogy
vgbeavatkoz szervket (end effector) a kvnt helyre vigyk, knnyebb vezrelni, mint azokat, amelyek csak a
minimlisan szksges szm szabadsgfokkal rendelkeznek.
Mobil robotoknl a szabadsgfokok szma nem felttlenl egyezik meg a mozgatott rszek szmval. Vegynk
pldul egy tlagos autt: tud mozogni elre-htra s tud fordulni. Ez gy kt szabadsgfok. Ennek ellenre a
kocsi kinematikja hromdimenzis: egy szabad lapos felleten knnyedn el tud jutni brmilyen (x, y) pontba,
tetszleges orientcival (lsd 25.3. (b) bra). Azaz a kocsinak 3 effektv szabadsgfoka (effective DOF) van,
de 2 irnythat szabadsgfoka (controllable DOF). A robotra azt mondjuk, hogy nemholonomikus
(nonholonomic), ha az effektv szabadsgfoka nagyobb, mint az irnythat szabadsgfoka, mg holonomikus
(holonomic), ha ez a kett megegyezik. A holonomikus robotokat knnyebb irnytani. Mennyivel egyszerbb
lenne olyan kocsival parkolni, amely kpes oldal irnyban is mozogni, nem csak elre-htra! Viszont a
holonomikus robotok jellemz mdon mechanikailag sokkal bonyolultabbak. A legtbb robotkar holonomikus,
mg a mobil robotok ltalban nemholonomikusak.
A mobil robotok szmra mozgat mechanizmusok szles trhza ll rendelkezsre: kerekek, lnctalpak, lbak
stb. A differencil hajts (differential drive) robotoknak ktoldalt kln mozgathat kerekeik (vagy
lnctalpaik) vannak, ugyangy, mint a tankoknak. Ha mindegyik kerk azonos sebessggel mozog, akkor a
jrm egyenesen halad elre. Ha ellenkez irnyba mozognak, akkor a robot kpes egy helyben megfordulni. A
2
798
Created by XMLmind XSL-FO Converter.
Robotika
msik alternatvt a szinkrn hajts (synchro drive) jelenti, amelynl minden kerk el tud fordulni a tengelye
mentn. Ez knnyen vezethetne koszhoz, ha nem lenne az a knyszer, hogy minden kerk mindig azonos
irnyba lljon, s azonos sebessggel forogjon. Mind a differencil, mind a szinkrn hajts nemholonomikus.
Egyes drga robotok holonomikus hajtst hasznlnak, ltalban hrom vagy tbb nllan irnythat kerkkel.
A kerekekkel ellenttben a lbak mg a nagyon nehz tereppel is megbirkznak. Ugyanakkor a lbak
meglehetsen lassak sk terepen, s mechanikailag nehezebb megpteni ket. Robotikai szakemberek
prbltak mr klnfle konstrukcikat, egytl akr tucatnyi lbig. Ksztettek lbbal rendelkez robotokat
stlsra, futsra, st mg ugrlsra is. Egy ilyen plda lthat a 25.4. (a) brn: ez a robot dinamikusan stabil
(dinamically stable), ami azt jelenti, hogy kpes talpon maradni, mikzben krbe ugrl. Statikusan stabilnak
(statically stabile) hvjk azokat a robotokat, amelyek gy kpesek llva maradni, hogy nem mozognak a
lbaik. A robot statikusan akkor stabil, ha a slypontja a lbai ltal kifesztett sokszg fl esik.
25.4. bra - (a) Marc Raibert egyik lpeget robotja mozgs kzben. (b) A Sony AIBO
robot focizs kzben (copyright 2001, The RoboCup Federation).
Ms tpus mobil robotok teljesen eltr mdszereket hasznlnak a mozgshoz. A lgi jrmveken ltalban
propellereket vagy turbinkat alkalmaznak. Robot lghajk a meleg ramlatokat hasznljk ki, hogy a levegben
maradjanak. Az autonm vz alatti jrmvek gyakran alkalmaznak a tengeralattjrkon hasznltakhoz hasonl
fvkkat.
Szenzorok s beavatkoz szervek nmagukban mg nem tesznek ki egy robotot. Egy igazi robotnak
energiaforrsra is szksge van, hogy mozgathassa beavatkoz szerveit. A legnpszerbb megolds mind a
manipultorok mozgatshoz, mind a helyvltoztatshoz, a villanymotor. Ugyanakkor a pneumatikus (srtett
gzzal mkd) s a hidraulikus (folyadkkal kzvettett nyomssal mkd) hajtsoknak is megvannak a
maguk alkalmazsi terletei. A legtbb robot valamifle digitlis kommunikcis eszkzzel is rendelkezik,
pldul vezetk nlkli hlzati kapcsolattal. Vgezetl szksg van valami vzra is, amelyre fel lehet szerelni
az alkatrszeket s az eszkzket, valamint egy forrasztpkra, ha az alkatrszek s eszkzk megsznnek
mkdni.
3. rzkels a robotikban
Az rzkels az a folyamat, amelynek sorn a robot a szenzoraibl rkez jeleket krnyezetnek bels
reprezentcijra kpezi le. Az rzkels nehz, mivel ltalban a szenzorok adatai zajjal terheltek, a krnyezet
csak rszlegesen megfigyelhet, nem jsolhat viselkeds s gyakran dinamikus is. klszably, hogy egy j
bels reprezentcinak hrom tulajdonsga van: elg informcit hordoz ahhoz, hogy a robot a megfelel
dntst meghozhassa; strukturltsga lehetv teszi, hogy hatkonyan frissthet legyen; valamint termszetes
799
Created by XMLmind XSL-FO Converter.
Robotika
olyan rtelemben, hogy a bels llapotvltozk megfeleltethetk egy-egy vals fizikai vilgbeli
llapotvltoznak.
A 15. fejezetben megmutattuk, hogy a Kalman-szrk, a rejtett Markov-modellek s a dinamikus Bayes-hlk
alkalmasak egy rszlegesen megfigyelhet krnyezet llapottmenet- s rzkel modelljeinek a
reprezentlsra. Ismertettnk egzakt s kzelt algoritmusokat a bels hiedelmi llapot (belief state) a
krnyezet llapotvltozi felett rtelmezett a posteriori valsznsg-eloszls frisstsre. Erre szmos
dinamikus Bayes-hls modellt mutattunk be a 15. fejezetben. Robotikai problmk esetben a modellhez
ltalban megfigyelt vltozknt a robot sajt korbbi cselekvseit is hozzveszszk, mint ahogy az a 17.9. bra
hlzatn lthat. A 25.5. bra ennek a fejezetnek a jellseit mutatja: Xt a krnyezet llapota (belertve a
robotot is) a t idpillanatban; Zt a t idpontbeli megfigyels (az rzkelsbl szrmaz adatok), az At pedig az
rzkelst kveten vgzett cselekvs.
A szrsi (filtering) feladat, vagyis a hiedelmi llapot frisstse alapveten azonos a 15. fejezetben
trgyaltakkal. A feladat az j hiedelmi llapot, P(Xt+1|z1:t+1, a1:t) kiszmtsa a P(Xt|z1:t, a1:t1) aktulis hiedelmi
llapotbl s az j zt+1 megfigyelsbl. Az alapvet klnbsg az, hogy (1) explicit felttelekkel lnk mind a
dntst, mind a megfigyelst illeten, (2) folytonos vltozkkal kell dolgoznunk diszkrtek helyett. Ezrt
mdostanunk kell a (15.3)-as rekurzv szralgoritmust, integrlt hasznlva az sszegzs helyett:
Az egyenlet azt fejezi ki, hogy az X llapotvltoz feletti a posteriori eloszlst a t + 1 idpillanatbani rekurzvan
szmtjuk az egy idlpssel korbbi megfelel becslsbl. A szmtsokhoz felhasznljuk a korbbi cselekvst,
at-t, s az aktulis szenzoros megfigyelst, zt+1-et. Pldul ha clunk egy futballoz robot fejlesztse, akkor Xt+1
lehet a labda relatv helyzete a robothoz kpest. A posteriori P(Xt|z1:t, a1:t1) mindazon llapotok felett rtelmezett
valsznsg-eloszls, amelyek megrzik mindazt, amit a korbbi rzkel mrsekbl s irnytsokbl
tudunk. A (25.1) egyenlet megmondja, hogyan becsljk rekurzvan ezt a pozcit, folyamatosan felhasznlva
az jabb szenzoradatokat (pldul kamerakpek) s a robot mozgsparancsait. A P(Xt+1|xt, at) valsznsget
llapottmenet-modellnek (transition model) vagy ms nven mozgsmodellnek (motion model) hvjuk, mg
P(zt+1|xt+1) az rzkel modell (sensor model).
3.1. Helymeghatrozs
A helymeghatrozs (localization) jellemz plda a robotrzkelsre. A problma lnyege a dolgok pontos
helyzetnek meghatrozsa. A helymeghatrozs az egyik legfontosabb rzkelsi feladat a robotikban, mivel a
fizikai krnyezettel val sikeres klcsnhatshoz felttlenl szksges. Pldul a robotkaroknak tudniuk kell,
800
Created by XMLmind XSL-FO Converter.
Robotika
hol van az a trgy, amivel dolgozni akarnak. A navigl robotoknak pedig pontosan ismernik kell sajt
helyzetket, hogy eljuthassanak a cljukhoz.
A helymeghatrozsi feladat hrom, egyre nehezebb problmaknt jeletkezik. Ha a trgy kezdeti pozcija s
irnya (orientcija) ismert, akkor a helymeghatrozs tulajdonkppen kvetsi feladatot (tracking) jelent, s
ez korltos bizonytalansggal jellemezhet. Ennl nehezebb a globlis helymeghatrozs (global
localization), amikor is a kezdeti pozci egyltaln nem ismert. A globlis helymeghatrozs kvetsi
problmv egyszersdik, ha sikerl lokalizlni a kvnt trgyat, de itt is elfordulhatnak olyan esetek, amikor
a robotnak nagyon nagy bizonytalansgokkal kell megbirkznia. Vgezetl lehetnk gonoszak is a robotunkkal,
ha elvesszk, elraboljuk elle az ppen lokalizlni prblt trgyat. Ezt elrablsos problmnak (kidnapping
problem) hvjk, s gyakran tesztelik vele a robot lokalizcis algoritmusnak robusztussgt extrm
krlmnyek kztt.
25.6. bra - (a) Egy mobil robot egyszerstett kinematikai modellje. A robotot a kr
jelkpezi, s a bevgs mutatja a haladsi irnyt. Kln-kln lthatjuk a t-beli s a t +
1-beli pozcit s orientcit a vt t s t t frisstsi rtkekkel. Szintn fel van tntetve
egy t idpontban megfigyelt referenciapont (tereptrgy) az (xi, yi) pontban. (b) A
psztz tvolsgmrs modellje. Egy adott tvolsg mrshez (z1, z2, z3, z4) tartoz kt
lehetsges robothelyzet lthat. Sokkal valsznbb, hogy a bal oldali helyzetbl
szrmaznak a tvolsgmrsek.
Azrt, hogy egyszerv tegyk a dolgot, felttelezzk, hogy a robotunk lassan mozog sk terepen, s pontos
trkpe van a krnyezetrl. (Egy ilyen trkp lthat a 25.8. brn.) Egy mobil robot helyzett kt derkszg
koordintjval (x, y) s az irnyt jellemz szggel rjuk le, ahogy ez a 25.6. (a) brn is lthat. (Mivel nem
foglakoztunk a hozz tartoz sebessgekkel, ez inkbb kinematikai, mint dinamikus modell.) Ha ezt a hrom
rtket egy vektorba fogjuk ssze, akkor brmely llapot megadhat Xt = (xt, yt, qt) formban.
Kinematikai kzeltsben minden cselekvs felbonthat kt pillanatnyi sebessgre: egy vt (transzlcis)
sebessgre s egy wt (rotcis) szgsebessgre. Kis t idkre a robot mozgsnak egy durva determinisztikus
modellje az albbi alakban adhat meg:
Az
jells a determinisztikus llapotbecslsre vonatkozik. Termszetesen a fizikai robotok valamilyen
mdon mindig megjsolhatatlanok maradnak. Ezt gyakran modellezik egy f(Xt, vt, t) kzprtk, x
kovariancij Gauss-eloszlssal. (Lsd mg az A) fggelk matematikai definciit.)
801
Created by XMLmind XSL-FO Converter.
Robotika
A kvetkez lpsben szksgnk van egy rzkel modellre. Ktfle rzkel modellrl beszlhetnk. Az els
azon alapul, hogy a szenzor referenciapontoknak (landmarks) nevezett lland s felismerhet
jellemvonsokat rzkel s azonost a krnyezetben. Minden referenciapontrl meghatrozza annak tvolsgt
s szgt. Tegyk fel, hogy a robot az xt = (xt, yt, qt) llapotban van, s rzkel egy ismert (xi, yi) helyen lv
referenciapontot. Ha nem vesszk bele az rzkels zajossgt, egyszer geometrival megkaphat a tvolsg s
a szg (lsd a 25.6. (a) bra). Megfigyels alapjn a pontos becsls a tvolsgra s a szgre:
A zaj most is torztja a mrseinket. Egyszerstsl Gauss-eloszls, z kovariancij i zajt ttelezhetnk fel:
A 25.2. brn bemutatott tvolsgszenzorokhoz kicsit msfle rzkel modell is megfelel lehet. Az ilyen
rzkelk egy zt = (z1,, zM) vektort adnak vissza tvolsgadatokkal, amelyek a robothoz kpest rgztett
irnyokban lv trgyakrl hordoznak informcit. Adott xt pozciban legyen
a j-edik sugr irnyba lv
legkzelebbi akadly pontos tvolsga. Csakgy, mint korbban, most is Gauss-zajt tteleznk fel. ltalnosan
vehetjk gy, hogy a klnbz sugrirnyokbeli hibk fggetlenek s azonos eloszlsak, gy:
A 25.6. (b) bra egy pldt mutat be ngyirny tvolsgmr szkennerre, kt klnbz pozci esetn. A kett
kzl az egyik sokkal nagyobb valsznsggel adhatta a megfigyels ngy rtkt. sszehasonltva a psztz
tvolsgmrses modellt a referenciapontos modellel lthat, hogy az elbbinek az az elnye az utbbival
szemben, hogy nincs szksg egy referenciapont azonostsra mieltt egy tartomnypsztzs rtelmezhet
lenne. St az is elfordulhat ahogy a 25.6. (b) bra esetben is , hogy a robot egy jellegtelen fallal tallkozik.
Ugyanakkor, ha van egy tisztn lthat, azonosthat referenciapont, akkor abbl azonnal megkaphat a pontos
helyzet.
A 15. fejezetben mr tallkoztunk a Kalman-szrvel, amely a hiedelmi llapotot egyetlen tbbvltozs Gausseloszlssal reprezentlja, illetve a rszecskeszrvel, amely a hiedelmi llapotot az llapotokhoz rendelt
rszecskeegyttessel reprezentl-ja. A legtbb modern lokalizl algoritmus e kt mdszer egyikt hasznlja a
robot P(Xt|z1:t, a1:t1) hiedelmi llapotnak lekpezsre.
A rszecskeszrs lokalizcis algoritmust Monte Carlo lokalizcinak (Monte Carlo localization, MLC)
hvjk. Az MCL alapveten megegyezik a 15.15. brn bemutatott rszecskeszrs algoritmussal, mindssze
annyit kell mdostanunk, hogy szksgnk van a megfelel mozgs s szenzor modellre. A 25.7. bra bemutat
egy vltozatot, psztz tvolsgmrses modellel. Az algoritmus mkdst, azt, hogy hogyan azonostja a
robot sajt tartzkodsi helyt az irodapletben, a 25.8. bra szemllteti. Az els kpen mg a rszecskk
egyenletesen oszlanak el, az elzetes informci alapjn, jelkpezve a teljes bizonytalansgot a robot pozcijt
illeten. A msodik kpen mr az els mrsek alapjn klasztereket alkotnak a rszecskk, oda tmrlve, ahol
valsznleg tartzkodik a robot. A harmadik esetben pedig mr elg informci ll rendelkezsre a mrsekbl,
hogy az sszes rszecske ugyanoda jusson.
25.8. bra - A Monte Carlo lokalizci, egy rszecskeszr algoritmus mobil robotok
pozcijnak meghatrozsra. Fell: a kezdeti, teljes bizonytalansg. Kzpen:
nagyjbl ktplus bizonytalansg, miutn a robot elindult a kzps (szimmetrikus)
folyosn. Alul: egyetlen pont kr szklt bizonytalansg, miutn bement az egyik
irodba.
802
Created by XMLmind XSL-FO Converter.
Robotika
803
Created by XMLmind XSL-FO Converter.
Robotika
25.7. bra - A Monte Carlo lokalizl algoritmus, fggetlen zajjal terhelt psztz
tvolsgmrses modellt hasznlva
A Kalman-szr a msik szles krben hasznlt lokalizl algoritmus. A Kalman-szr a P(Xt|z1:t, a1:t1)
posteriort egy Gauss-eloszlssal reprezentlja. Az eloszls kzprtkt t-vel, kovariancijt pedig t-vel
jelljk. A f problma a Gauss-hiedelmekkel az, hogy csak lineris mozgsi modell, f s lineris mrsi
modell, h mellett zrtak. Nemlineris f vagy h esetn a szr frisstsnek eredmnye ltalban mr nem lesz
Gauss-eloszls. gy Kalman-szrt hasznl lokalizcis algoritmusok linearizljk a mozgsi s az rzkel
modelleket. A linearizls egy nemlineris fggvny adott loklis lineris kzeltse. A 25.9. bra a linearizls
elvt mutatja be egy (egydimenzis) robotmozgsi modellen. A bal oldalon fut a mozgs nemlineris f(xt, at)
modellje (az at vezrls nem szerepel az brn, mert nem jtszik szerepet a linearizlsban). A jobb oldalon ezt
egy f(xt, at) lineris fggvnnyel kzeltjk. A lineris fggvny a t pontban rinti az f-et, ami a t idre
vonatkoz becslsnk kzprtke. Ezt a linearizlst (els fok) Taylor-sorfejtsnek (Taylor expansion)
hvjk. Az olyan Kalman-szrt, amely f-et s h-t Taylor-sorfejtssel linearizlja, kiterjesztett Kalmanszrnek (KKSZ; extended Kalman Filter EKF) hvjuk. A 25.10. bra egy KKSZ helymeghatroz
algoritmust hasznl robot becslssorozatt mutatja. Ahogy a robot halad, a helyzetre vonatkoz becsls
bizonytalansga egyre n, ahogy azt a hibaellipszis is mutatja. A hiba cskken, ahogy a robot egy ismert
elhelyezkeds referenciapont tvolsga s szge alapjn javtani tudja sajt helyzetre vonatkoz becslst. A
hiba vgl jra nni kezd, ahogy a referenciapont kikerl a robot ltkrbl. A KKSZ algoritmus jl mkdik,
ha knnyen azonosthat referenciapontok vannak. Ellenkez esetben az a posteriori eloszls multimodlis is
lehet, mint a 25.8. (b) brn. A referenciapontok azonostsnak szksgessgt jelent problma csak egy plda
a 15. fejezet vgn trgyalt adatasszocicis (data association) problmnak.
804
Created by XMLmind XSL-FO Converter.
Robotika
3.2. Trkpezs
Az elzk sorn egyetlen trgy helymeghatrozsnak problmjt trgyaltuk meg. A robotikban azonban
ltalban egyszerre tbb trgy helyzett kell meghatrozni. A klasszikus plda erre a feladatra a trkpezs.
Kpzeljnk el egy robotot, amelyiknek nincs pontos trkpe a krnyezetrl, magnak kell azt elksztenie. Az
ember fantasztikus kpessgeket fejlesztett ki, hogy feltrkpezze krnyezett, mra mr az egsz bolygt.
Termszetesen add feladat egy olyan algoritmus kitallsa, amely kpess teszi ugyanerre a robotot is.
Az irodalomban a robottrkpezs problmjt gyakran mint szimultn helymeghatrozst s trkpezst
(SZLT; simultaneous localization and mapping, SLAM) emltik. A robotnak nem csupn egy trkpet kell
konstrulnia, hanem ezt anlkl kell tennie, hogy ismern, maga hol tartzkodik. Az SZLT az egyik alapvet
robotikai problma. Azt a vltozatot fogjuk tekinteni, amikor a krnyezet lland. A feladat gy is meglehetsen
bonyolult; s mg nehezebb vlik, ha megengedjk, hogy a krnyezet vltozzon, ahogyan a robot mozog
benne.
Statisztikai oldalrl nzve a trkpezs egy Bayes kvetkeztetsi problma, csakgy, mint a lokalizci. Jelljk
M-mel a trkpet s Xt-vel a robot t pillanatbeli helyzett, mint ahogy azt korbban is tettk. Ekkor trhatjuk a
(25.1) egyenletet, hogy a posterior tartalmazza a teljes trkpet is:
805
Created by XMLmind XSL-FO Converter.
Robotika
Taln a legszlesebb krben hasznlt mdszer az SZLT-problma megoldsra a KKSZ. A szrhz ltalban
trstanak mg egy referenciapont-rzkel modellt is, valamint kittel, hogy az sszes referenciapont
megklnbztethet legyen. A korbbiakban a posterior becslst egy t vrhat rtk, t kovariancij Gausseloszlssal jellemeztk. Az SZLT/problma KKSZ-megkzeltsnl a posterior megint csak Gauss-eloszls
lesz, de most a kzprtk egy sokkal nagyobb vektor. Nemcsak a robot helyzett rgzti, hanem tartalmazza a
trkp sszes jellemzjt (vagy referenciapontjt) is. Amennyiben n ilyen jellemznk van, akkor a vektor 2n + 3
dimenzis lesz (kt paramterrel rhat le a referenciapontok helyzete s hrommal a robot pza).
Kvetkezskppen a t mtrix (2n + 3)-szor (2n + 3)-as lesz, az albbi struktrval:
806
Created by XMLmind XSL-FO Converter.
Robotika
Ezen becslsek fontos jellemzje ami egyltaln nem magtl rtetd az brkon , hogy a becslseket
egyetlen Gauss-eloszls jellemzi. A 25. 11. brn lthat hibaellipszisek csupn ennek az eloszlsnak a vetletei
a robot- s referenciakoordintk alterbe. Ez a tbbvltozs Gauss a posteriori eloszls tartja fenn a korrelcit
az sszes becsls kztt. Fontos ez az szrevtel annak megrtshez, hogy mi trtnik a 25.11. (d) brn. Itt a
robot szrevesz egy korbban mr feltrkpezett referenciapontot. Ennek kvetkeztben sajt pozcijnak
bizonytalansga drasztikusan cskken, mint ahogy az szszes tbbi referenciapont bizonytalansga is. Ez annak
a kvetkezmnye, hogy a robot s a pontok helyzetnek becslse ersen korrelltak a Gauss a posteriori
eloszlsban. Brmilyen j informci egy vltozrl (ebben az esetben a robot helyzetrl) automatikusan
cskkenti az sszes tbbi vltoz bizonytalansgt.
A trkpezshez hasznlatos KKSZ algoritmus hasonlt a korbban a lokalizcihoz hasznlt KKSZ-re. A
legfontosabb klnbsget a referenciapont-vltozk hozzadsa jelenti a posteriorban. A referenciapontok
mozgsmodellje trivilis: nem mozognak. gy az f fggvny azokra a vltozkra az identitsfggvny. A mrsi
fggvny alapveten megegyezik a korbban hasznlttal. Az egyetlen klnbsg a KKSZ frisstsi egyenletben
az, hogy a Ht Jacobi-mtrixnak nemcsak a robot pozcijt kell figyelembe vennie, hanem a referenciapontok tben megfigyelt helyzett is. Az gy kapott KKSZ-egyenletek mg ijesztbbek, mint a korbbiak, ezrt itt nem is
trgyaljuk ket.
Ugyanakkor van mg egy nehzsg, amit szp csndben figyelmen kvl hagytunk eddig: az M trkp mrett
nem tudjuk elre. Ebbl kifolylag a vgs becslshez tartoz t s t elemeinek szma szintn ismeretlen.
807
Created by XMLmind XSL-FO Converter.
Robotika
Ezeket dinamikusan kell meghatrozni, ahogy a robot jabb referenciapontokat tall. A problma megoldsa
elg egyszer: amikor a robot felfedez egy j referenciapontot, egyszeren hozzad egy j elemet a
posteriorhoz. Ha ennek az j elemnek a variancijt nagyon nagy kezdeti rtkre vlasztjuk, akkor az
eredmnyl kapott posterior ugyanaz, mintha a robot mr korbban is tudott volna annak a referenciapontnak a
ltezsrl.
4. Mozgstervezs
A robotikban a dntsek vgl is a beavatkoz szervek mozgsban jutnak kifejezsre. A ponttl pontig
mozgs (point-to-point motion) esetn a cl a robotnak vagy vgbeavatkoz szervnek egy megadott helyre
val eljuttatsa. Nagyobb kihvst jelent a kvet mozgs (compliant motion), amikor is a robot gy mozog,
hogy kzben vgig fizikai kontaktusban marad egy akadllyal. Plda erre, amikor egy robotkar becsavar egy
gt, vagy amikor vgigtol az asztalon egy dobozt.
Azzal kell kezdennk, hogy keresnk egy megfelel reprezentcit, amely alkalmas a mozgstervezsi
problmk lersra s megoldsra. Kiderl, hogy a konfigurcis tr (configuration space) a
robotllapotok tere, amelyet a pozci, az orientci s a csuklszgek definilnak alkalmasabb a feladatra,
mint a 3D tr. A plyatervezs (path planning) azt jelenti, hogy meg kell tallni az egyik konfigurcitl egy
msikig vezet utat. A korbbi fejezetekben mr szmos ttervezsi mdszert vzoltunk fel. A robotikban az
ttervezs legfbb jellemvonsa az, hogy folytonos terekkel dolgozik. A szakirodalom szmos klnbz
technikt tart szmon, amelyek kifejezetten olyan esetekre alkalmazhatk, ahol a cl tvonalak keresse
sokdimenzis folytonos terekben. Kt f megkzelts ltezik: a celladekompozci (cell decompisition) s a
szkeletonizci (skeletonisation). Mindkett diszkrt grf keressi feladatra vezeti vissza s egyszersti le a
folytonos tkeressi problmt azltal, hogy kanonikus llapotokat s plykat r le a folytonos trben. Ebben a
fejezetben vgig felttelezzk, hogy a mozgs determinisztikus, s a robot helybli azonostsa egzakt. A
ksbbi fejezetek gyengteni fogjk ezeket a felttelezseket.
4.1. Konfigurcis tr
A robotmozgsi feladatok megoldsnak els lpseknt a problmhoz ki kell tallni egy megfelel
reprezentcit. Kezdjk egy egyszer problma egyszer brzolsval. Vegyk a 25.12. (a) brn lthat
robotkart. Kt csuklval rendelkezik, amelyek egymstl fggetlenl mozoghatnak. Ha a csuklkat mozgatjuk,
megvltozik a knyk s a megfog (x, y) koordintja. (A kar z irnyban nem kpes elmozdulni.) Mindez azt
sugallja, hogy a robot konfigurcii lerhatk egy ngydimenzis koordinta-rendszerben, ahol: (xknyk, yknyk)
jelenti a knyk relatv helyzett a krnyezethez kpest, mg (xmegfog, ymegfog) a megfog helyzett. Vilgos, hogy
ez a ngy koordinta lerja a robot sszes lehetsges llapott. Ezt a lerst munkatr-reprezentcinak
808
Created by XMLmind XSL-FO Converter.
Robotika
(workspace representaion) is nevezik, mivel a robot helyzett ugyanabban a koordinta-rendszerben rjuk le,
mint a mozgatni (vagy ppen elkerlni) kvnt trgyakt. A munkatr-reprezentci jl hasznlhat tkzs
elkerlsre, klnsen akkor, ha a trgyakat egyszer poligonokknt modellezzk.
A munkatr-reprezentcival az a problma, hogy a robot szmra nem minden munkatr-koordinta rhet el,
mg akkor sem, ha nincsenek akadlyok. Ez a munkatr elrhet koordintira vonatkoz sszekapcsolsi
knyszerek (linkage constrains) miatt van. Pldul a knyk (xknyk, yknyk) s a megfog (xmegfog, ymegfog)
pozcija egymstl mindig adott tvolsgra van, mert egy merev alkar kapcsolja ket ssze. Ha a robotmozgstervezs munkatr-koordintkban trtnik, akkor a generlt tvonalaknak mindig meg kell felelnik ezeknek a
knyszereknek. Ez azrt klnsen nehz, mert az llapottr folytonos, a knyszerek pedig nemlinerisak.
Knnyebb a dolgunk, ha konfigurcis trben (configuration space) terveznk. Ahelyett hogy Descarteskoordintkkal rnnk le a robot helyzett a trben, a csuklk konfigurcijt vesszk figyelembe. A pldban
szerepl robotnak kt csuklja van, gy llapott a kt csukl llsval jellemezhetjk:
jelenti a vllcsukl
szgt, mg
a knykcsuklt. Ha semmilyen akadly sincs a munkatrben, akkor a robot csukli
brmilyen rtket szabadon felvehetnek a konfigurcis trben. St plyatervezs sorn a kiindulsi s a
clkonfigurci egyszeren sszekthet egy egyenessel. A robot ezt az egyenest kvetve konstans sebessggel
mozgatja csuklit, amg el nem ri a kijellt helyet.
Sajnlatos mdon azonban a konfigurcis trnek is megvannak a maga problmi. A robot feladatai ltalban a
munkatr koordintiban adottak, s nem a konfigurcis trben. Konkrtan pldul azt akarjuk, hogy a robot
vgberendezst a munkatrben egy adott pontra mozgassa, st esetleg mg az orientci is adott. Ez felveti azt
a krdst, hogy hogyan kpezzk le a munkatr-koordintkat a konfigurcis trbe. ltalban ennek a
problmnak az inverze egyszerbb, azaz knnyebben kpezhetk le a konfigurcis tr koordinti a
munkatrbe, hiszen a problma nhny egyrtelm koordinta-transzformcival megoldhat. Ezek a
transzformcik linerisak transzlcis, s trigonometrikusak rotcis csuklk esetn. A transzformcik
sorozatt kinematiknak (kinematics) hvjk. Ezzel a kifejezssel mr tallkoztunk korbban, a mobil
robotoknl.
Inverz kinematiknak (inverse kinematics) hvjk egy olyan robot konfigurcijnak kiszmtst, ahol a
robot beavatkoz szerveinek helyzete a munkatr koordintiban adott. Az inverz kinematikai szmtsok
ltalban nehezek, klnsen sok szabadsgfok robotok esetben. St a megolds ritkn egyrtelm.
Pldarobotunk esetben kt klnbz konfigurci is ltezik, amikor a megfog ugyanazt a helyzetet veszi fel
a munkatrben, mint ami a 25.12. brn lthat.
ltalban kt szabadsgfok (2DOF) robotkar esetn az inverz kinematikai feladat megoldsainak szma nulla
s kett kztt van, brmilyen bemeneti munkatr-koordintra. A legtbb ipari robot esetn vgtelen sok
megolds van. Ennek megrtshez kpzeljk el, hogy a pldarobotunkhoz hozzadunk mg egy rotcis
csuklt, aminek tengelye prhuzamos a meglv csuklk egyikvel. gy a legtbb konfigurci esetn szabadon
tudjuk mozgatni a kzbls csuklkat, mikzben a megfog pozcija nem vltozik (az orientcija azonban
igen). Nhny tovbbi csuklval (mennyivel?) megoldhat, hogy a kart ugyangy mozgatva az orientci se
vltozzon. Mr lttunk erre pldt, amikor letettk keznket az asztalra, s mgis tudtuk mozgatni a
knyknket. A kz pozcijbl add kinematikai korltozsok alapjn mg nem hatrozhat meg
egyrtelmen az emberi knyk konfigurcija. Ms szavakkal, a vll-kar egyttes inverz kinematikai
problmjra vgtelen sok megolds ltezik.
25.12. bra - (a) Egy kt szabadsgfok robotkar munkatere. A munkatr egy doboz,
amiben egy lapos akadly lg a mennyezetrl. (b) Ugyanennek a robotnak a
konfigurcis tere. A fehrrel jelzett terlet jelenti azokat a konfigurcikat, ahol a
robot nem tkzik ssze semmivel. A pont az brn a robot bal oldali konfigurcijt
mutatja.
809
Created by XMLmind XSL-FO Converter.
Robotika
A msik problma a konfigurcis trrel kapcsolatosan akkor merl fel, amikor akadlyok is vannak a
munkatrben. A 25.12. (a) brn lthat esetben pldul szmos ilyen akadly van; az egyik pont a robot
munkaternek kzepbe nylik bele. A munkatrben ezek az akadlyok egyszer geometriai formkknt
jelennek meg, klnsen a robotikai tanknyvekben, ahol a poligonlis akadlyokra fkuszlnak. De hogyan
nznek ki ezek a konfigurcis trben?
Pldarobotunk konfigurcis tert mutatja a 25.12. (b) bra a 25.12. (a) brn lthat akadlyok esetre. A
konfigurcis teret kt altrre bonthatjuk: azoknak a konfigurciknak a terre, amelyek elrhetk ez a szabad
tr (free space), illetve az elrhetetlen konfigurcik ltal alkotott trrszre, amit foglalt trnek (occupied
space) hvnak. A 25.12. (b) brn a fehr rsz jelenti a szabad teret, mg az sszes tbbi a foglalt tr. A
klnbz rnyalatok jelzik, hogy melyik akadlyrl is van sz: a szabad teret krbehatrol fekete rszek
jelentik azokat a konfigurcikat, amelyeknl a robot nmagval tkzik ssze. Knny beltni, hogy a vll- s
knykcsuklk szls llsai ezt eredmnyezik. A robot kt oldaln lv ovlis rszek az asztalnak felelnek
meg, amin a robot ll. A harmadik ovlis terlet a bal oldali fal. Vgezetl, a konfigurcis trben a
legklnsebb alakzat a robot mozgsterbe belelg, egyszer fggleges elem. Ennek igen klns alakja
van, ersen nemlineris, s helyenknt mg konkv is. Egy kis kpzelervel felismerhetjk a megfog alakjt a
bal fels szln. Szaktsunk egy kis idt ennek a fontos brnak a tanulmnyozsra. Az alakzat egyltaln nem
nyilvnval! A 25.12. (b) brn a pont a robot 25.12. (a) brn lv llapotnak megfelel konfigurcit
mutatja. A 25.13. brn tovbbi hrom konfigurcit is lthatunk, mind a munkatrben, mind a konfigurcis
trben. A conf-1 llsban a megfog megkzelti a kzps akadlyt.
A legtbb esetben a szabad tr alakja nagyon bonyolult a konfigurcis trben, mg akkor is, ha a munkateret
egyszer poligonokkal reprezentljuk. ppen ezrt a gyakorlatban inkbb feltrkpezik a konfigurcis teret,
semmint pontosan kiszmtjk. A trkpezs sorn generlnak egy konfigurcit, s megnzik, hogy az a szabad
trben van-e. Ehhez alkalmazzk a robot kinematikjt, s annak alapjn mr ltszik, ha az adott konfigurci
tkzssel jr a munkatrben.
810
Created by XMLmind XSL-FO Converter.
Robotika
811
Created by XMLmind XSL-FO Converter.
Robotika
A fenti problmk elkerlse rdekben a celladekompozcis mdszeren ktflekppen lehet javtani. Az els,
ha megengedjk a vegyes cellk tovbb osztst mondjuk az eredeti mret felre. Ezt rekurzvan folytathatjuk,
amg nem tallunk olyan utat, ami csak szabad trben lv cellkon megy t. (Termszetesen a mdszer csak
akkor mkdik, ha egy adott cellrl egyrtelmen el tudjuk dnteni, hogy vegyes-e. Ez viszonylag knny, ha
a konfigurcis tr hatrai matematikailag egyszeren lerhatk.) Akkor teljes a mdszernk, ha ltezik korlt a
legkeskenyebb tjrra, amin az tvonal bejrhat. Annak ellenre, hogy a konfigurcis tren bell alapveten
a bonyolultabb, trkksebb rszekre fkuszldik a szmtsi igny, mg mindig nem lesznk kpesek
sokdimenzis problmk kezelsre, mivel a cellk minden rekurzv jraosztsa 2d kisebb cellt hoz ltre. A
msik megolds sorn azzal tesszk teljess az algoritmusunkat, hogy ragaszkodunk a szabad tr egy egzakt
celladekompozcijhoz (exact cell decomposition). Ez a mdszer megengedi, hogy a cellk szablytalan
alakak legyenek, de kizrlag a szabad tr hatrn. Az alakzatoknak viszonylag egyszereknek kell maradniuk,
hogy knnyen meg lehessen hatrozni egy szabad cella tljt. Ez a technika bizonyos magasabb szint
geometriai ismereteket ignyel, ezrt rszletesebben nem trgyaljuk.
Ha megvizsgljuk azt a plyt, amit a 25.14. brn kaptunk, lthatjuk, hogy mg tovbbi nehzsgeket kell
lekzdennk. Elszr is, vegyk szre, hogy a plya mentn nagyon les kanyarok vannak. A robot brmilyen
vges sebesessggel mozog, nem tudja ezeket bevenni. Msodszor, az t helyenknt nagyon kzel halad el az
akadlyok mellett. Mindenki, aki mr vezetett autt, tudja, hogy egy olyan parkolhely, ahol csak egy-egy
millimter szabad hely van mindkt oldalon, valjban nem is parkolhely. ppen ezrt olyan megoldsokra
treksznk, amelyek robusztusak a kis mozgsi hibkra nzve.
25.15. bra - (a) A taszt potenciltr tvol tartja a robotot az akadlyoktl. (b) A
megoldsknt kapott plya, ha egyszerre minimalizljuk az thosszt s a
potencilfggvnyt.
812
Created by XMLmind XSL-FO Converter.
Robotika
813
Created by XMLmind XSL-FO Converter.
Robotika
Ilyen mdon az eredeti tkeressi feladatot a Voronoi-grfon lv tvonal megtallsra redukltuk. A Voronoigrf (nhny klnleges esetet leszmtva) egydimenzis, s vges sok olyan pontja van, ahol hrom vagy tbb
grbe metszi egymst. gy azon a legrvidebb t megtallsa egy diszkrt grfkeressi problma, amilyet a 3. s
4. fejezetekben mr trgyaltunk. Ha a Voronoi-grf mentn haladunk, akkor nem a legrvidebb utat kapjuk, de
az egyik legbiztonsgosabbat. A htrnya ennek a mdszernek, hogy nehz tbbdimenzis konfigurcis terekre
alkalmazni, s sokszor tl nagy kitrket tesz, fleg ha a szabad tr nagyon tg. Ezenfell a Voronoi-diagram
szmtsa bonyolult lehet a konfigurcis trben, klnsen ahol az akadlyok alakja nagyon sszetett.
Alternatvt jelent a Voronoi-diagramokkal szemben a valsznsgi thlzat (probabilistic roadmap)
mdszere. Ez a szkeletonizcis technika tbb lehetsges tvonallal dolgozik, gy jobb megoldst jelent nagy,
nyitott terek esetn. A valsznsgi thlzatra lthat plda a 25.16. (b) brn. A grfot vletlenszeren
generlt, a szabad trbe es, nagyszm konfigurci alkotja. Ezek utn kt csompontot sszektnk egy llel,
amennyiben knny eljutni egyikbl a msikba. Alapveten egyenes lekkel dolgozunk, s azok
termszetesen csakis a szabad trben futhatnak. Eredmnyl egy vletlenszer grfot kapunk a robot szabad
terben. Ha ehhez mg hozzvesszk a kezdeti s a clkonfigurcit, az tkeress diszkrt grfkeressi
problmv vlik. Elmletileg a mdszer nem teljes, mivel rosszul felvett ponthalmazzal lehet, hogy soha nem
tallunk megoldst. A felvett pontok szma s a konfigurcis tr alakja alapjn korltozhatjuk a kudarc
valsznsgt. Azt is megtehetjk, hogy fknt azon a terleten generlunk pontokat, ahol egy elzetes,
mindkt vgpontbl lefuttatott rszleges keress alapjn sejtjk, hogy a helyes t visz majd. Ezekkel a
kiegsztsekkel a valsznsgi thlzat mdszere jobban hasznlhat ms technikknl magasabb dimenzij
konfigurcis terek esetben is.
814
Created by XMLmind XSL-FO Converter.
Robotika
Sajnlatos mdon azonban nem hagyhatjuk mindig figyelmen kvl a bizonytalansgot. Egyes problmk esetn
egyszeren tlsgosan nagy! Hogyan is hasznlhatnnk determinisztikus plyatervezst egy mobil robot
irnytshoz, ha fogalma sincs a robotnak arrl, hogy hol van? ltalban, ha a robot valdi llapota nem
egyezik meg a maximlis valsznsgi szably ltal szmtottal, akkor az irnyt algoritmus nem lesz
optimlis. Az eltrs nagysgtl fggen ez egy sor nem kvnatos esemnyt idzhet el, pldul tkzst ms
trgyakkal.
A robotikban szmos technikt dolgoztak ki a bizonytalansg kezelsre. Nhnyuk a 17. fejezetben trgyalt
bizonytalansgi dntshoz algoritmusokbl ered. Ha a robotnak csak az llapottmenetek kapcsn kell
bizonytalansggal szmolnia, msklnben llapota teljesen megfigyelhet, akkor a problmt legjobban a
Markov dntsi folyamattal (MDF) lehet modellezni. Az MDF ltal adott megolds optimlis eljrsmd
(policy), amely minden lehetsges llapotban megmondja a robotnak, hogy mit csinljon. Ezzel a mdszerrel
kpes brmifle mozgsi hiba kezelsre, ahol a determinisztikus ttervez egyetlen megoldsa sokkal kevsb
lenne robusztus. Robotikban a stratgikat ltalban navigcis fggvnyeknek (navigation functions) hvjk.
A 25.14. (a) brn bemutatott rtkfggvny knnyen talakthat ilyen navigcis fggvnny, ha egyszeren
kvetjk a gradienst.
Csakgy, mint a 17. fejezetben, a rszleges megfigyelhetsg itt is tovbb nehezti a problmt. Az gy
keletkez robotirnytsi problmt a rszlegesen megfigyelhet MDF-fel (RMMDF) modellezzk. Ilyen
esetekben a robotnak ltalban van egy bels kpe az llapotrl, ahogy azt mr a 25.3. alfejezetben
megtrgyaltuk. Az RMMDF-re a megolds a robot bels llapotn definilt stratgia. Mskpp megfogalmazva,
a stratgia bemenete egy teljes valsznsg-eloszls. Ez a robot szmra lehetv teszi, hogy ne csak az alapjn
tudjon dntst hozni, amit tud, hanem azt is felhasznlhassa, amit nem tud. Pldul ha nem ismeri egy kritikus
llapotvltoz rtkt, akkor sszeren informcigyjtst (information gathering) fog vgrehajtani. Az MDF
keretein bell erre van lehetsg, mivel az MDF teljes megfigyelhetsget felttelez. Sajnlatos mdon azok a
technikk, amelyek az RMMDF-eket pontosan megoldjk, nem alkalmazhatk a robotikban, minthogy nem
ismeretes folytonos idej vltozatuk. A diszkretizls ltalban olyan hatalmas mter RMMDF-eket
eredmnyez, amelyek messze meghaladjk a mai eszkzk feldolgozsi kapacitst. Jelen esetben a legtbb,
amit tehetnk, hogy megprbljuk a helyzet bizonytalansgt minimumra cskkenteni. A trgy menti
navigls (coastal navigation) heurisztikus mdszervel pldul jl cskkenthet a pozci ismeretnek
bizonytalansga, ha a robot vgig ismert referenciapontok kzelben halad. Ugyanakkor fokozatosan cskkenti
ms, kzeli referenciapontok helyzetnek bizonytalansgt is, ami aztn lehetv teszi a robot szmra, hogy
jabb terleteket trkpezzen fel.
Robotika
kpon bell, tetszlegesen. A 25.17. bra azt mutatja, mi trtnne, ha adott sebessggel elindtannk a mveletet
az s kezdpontbl. A mozgs bizonytalansga miatt a robot a szrke terleten bell brhova megrkezhet a
fellethez. Van r esly, hogy beletall a lyukba, de nagyobb valsznsggel valamelyik oldaln ll meg. Mivel
a robot nem fogja tudni, hogy a lyuk melyik oldaln van, ezrt azt sem fogja tudni, hogy merre mozduljon.
Egy kifinomultabb stratgia lthat a 25.18. s a 25.19. brn. A 25.18. bra esetben a robot szndkosan a
lyuknak az egyik oldala fel mozog. Az brn lthat a mozgsparancs s a lells felttele: valamely fellettel
val rintkezs. A 25.19. brn olyan a mozgsparancs, hogy a robot a fellet mentn mozdul el, mg bele nem
tall a lyukba. Ez nbell mozgsvezrls alkalmazst ttelezi fel. Mivel a mozgs irnya (a
bizonytalansggal egytt is) jobbra mutat, a robot mindig jobbra fog csszni, valahnyszor rintkezsbe kerl a
vzszintes fellettel. Amikor elri a lyukat, lecsszik annak jobb oldali szle mentn, mivel a fggleges
fellethez kpest valamennyi lehetsges vektor lefel mutat. Addig fog mozogni, amg el nem ri a lyuk aljt,
mivel ez szmra a lellsi felttel. A vezrls bizonytalansga ellenre a robot valamennyi lehetsges plyja a
lyuk aljval trtn rintkezsnl r vget. Mindenkppen ez trtnik, hacsak a fellet szablytalansgai miatt a
robot valahol meg nem akad.
Lthatjuk, hogy a finom mozgsok tervezse nem trivilis; valjban sokkal nehezebb, mint a pontos mozgsok
tervezse. Vagy minden egyes mozgshoz rgztett szm diszkrt rtket vlasztunk, vagy a krnyezet
geometrijt hasznljuk fel azon irnyok megllaptshoz, amelyek minsgileg klnbz viselkedst
eredmnyeznek. A finommozgs-tervez a konfigurcis tr lerst, a sebessgbizonytalansgi kp szgt s
azt a specifikcit tekinti inputnak, amely megadja a lehetsges lellsifelttel-rzkelseket (ebben az esetben a
fellettel val rintkezst). Az eredmnynek egy olyan tbblpses feltteles tervnek vagy stratginak kell
lennie, ami garantlja a sikert, ha egyltaln ltezik ilyen terv.
Pldnkban felttelezzk, hogy a terveznek pontos kpe van a krnyezetrl, de korltos hiba is bevezethet a
modellbe a kvetkezk szerint: amennyiben a hibk paramterekkel lerhatk, gy azok a paramterek
szabadsgfokok formjban hozzadhatk a konfigurcis trhez.
816
Created by XMLmind XSL-FO Converter.
Robotika
Az utols pldban, amennyiben a lyuk mlysge s szlessge bizonytalan, gy ezeket jabb kt szabadsgfok
formjban hozzvehetjk a konfigurcis trhez. Az nem lehetsges, hogy a robotot ezekbe az irnyokba
elmozdtsuk a konfigurcis trben, s a robot pozcijt sem tudjuk kzvetlenl rzkelni. Azonban mindkt
korltozst figyelembe vehetjk, amikor ezt egy FMT-problmaknt rjuk le, megfelelen specifiklva a
vezrls s az rzkels bizonytalansgait. Ez egy sszetett, ngydimenzis tervezsi problmhoz vezet,
azonban azonos tervezsi technikk alkalmazhatk. Megjegyezzk, hogy a 17. fejezetben ismertetett
dntselmleti mdszerektl eltren ez a fajta megkzelts a legrosszabb esetre vonatkoz terveket
eredmnyezi ahelyett, hogy a terv vrhat minsgt maximalizln. A legrosszabb esetre vonatkoz tervek
dntselmleti rtelemben csak akkor optimlisak, ha a vgrehajts kzbeni kudarc sokkal kltsgesebb, mint
brmely ms, a vgrehajts sorn felmerl kltsg.
6. Mozgs
Beszltnk mr arrl, hogyan tervezzk meg a mozgst, de arrl nem, hogy hogyan mozogjunk. Az eddigi
terveink klnsen azok, amelyeket determinisztikus plyatervezvel lltottunk el felttelezik, hogy a
robot egyszeren kpes kvetni brmilyen megtervezett plyt. A valsgban termszetesen nem ez a helyzet. A
robotoknak van tehetetlensgk, ezrt nem tudnak tetszleges plyt kvetni, csak nagyon kis sebessg esetn.
817
Created by XMLmind XSL-FO Converter.
Robotika
A legtbbszr ert kell kifejtenie a robotnak, nem pedig meghatrozott pozciba eljutnia. Ez a fejezet azokrl a
mdszerekrl szl, amelyekkel ki lehet szmtani ezeket az erket.
25.20. bra - Robotkarvezrls (a) egysgnyi ersts arnyos szablyozval; (b) 0,1-es
erstsi tnyezj arnyos szablyozval; (c) PD szablyozval, 0,3-as ersts
arnyos taggal s 0,8-as differencil komponenssel. Mindhrom esetben a robotkar a
szrkvel jellt plyt prblta kvetni.
Robotika
ahol Xt a robotkar t idpontbeli llapota. KP a szablyoz gynevezett erstsi tnyezje (gain parameter),
ami azt hatrozza meg, hogy milyen hevesen reagl a szablyoz az aktulis xt llapot s a kvnt y(t) kztt
lv eltrsre. A pldnkban KP = 1. Els pillantsra azt gondolhatja valaki, hogy ha KP-t kis rtkre
vlasztjuk, akkor az megoldja a problmt. Sajnos nem gy van. A 25.20. (b) brn lthat KP = 0,1 esetben a
trajektria, amely tovbbra is oszcilll. A kisebb erstsi tnyez csak lelasstotta az oszcillcit, de egyltaln
nem oldotta meg a problmt. Ha elhanyagoljuk a srldst, a P szablyoz tulajdonkppen egy rug, s a
vgtelensgig oszcilll a rgztett egyenslyi pont krl.
Hagyomnyosan az ilyen problmkat az irnytselmlet (control theory) trgykrbe soroljk. Ennek a
tudomnygnak egyre nagyobb a jelentsge a mestersges intelligencival foglalkoz kutatk szmra.
vtizedek kutatsai sorn szmos olyan szablyozt alkottak meg, amelyek lnyegesen bonyolultabbak a fent
hasznlt egyszer szablyoznl. Egy referenciaszablyoz stabil (stable), ha kis megvltozsok csak korltos
hibt eredmnyeznek a referenciajelhez kpest. Szigoran stabil (strictly stable), ha a robot a kis
megvltozsok ellenre is vissza tud trni a referenciaplyra. Lthat, hogy a P szablyoznk stabil, de nem
szigoran stabil, mivel kptelen visszatrni a referenciatrajektrira.
A legegyszerbb szablyoz, ami eleget tesz a szigor stabilits kvetelmnyeinek a mi esetnkben a PD
szablyoz (PD controller). A P bet tovbbra is az arnyosat jelli, mg a D a differencilt. A PD
szablyozt az albbi egyenlet rja le:
Ahogy az mr a kpletbl is ltszik, a PD szablyoz egy differencilis taggal egszti ki a P szablyozt, ami az
at-t egy olyan taggal bvti, ami arnyos az y(t) xt hiba id szerinti els derivltjval. Mi a hatsa egy ilyen j
tagnak? ltalban a derivtor csillaptja a szablyozott rendszert. Tegyk fel, hogy egy adott rendszerben
idben gyorsan vltozik az (y(t) xt) hiba, mint ahogyan a fentebb trgyalt esetben is. A differencilis tag
ilyenkor az arnyos ellenben hat, s sszessgben cskkenteni fogja a vltozsra trtn reakcit.
Ugyanakkor, ha a hiba llandsul, a differencilis tag httrbe szorul, s az arnyos tag fogja meghatrozni a
szablyozst.
PD szablyozt hasznlva KP = 0,3 s KD = 0,8 paramterekkel a 25.20. (c) brn lv trajektrit kapjuk. A
plya sokkal simbb, s nem lthat oszcillci sem. Ahogy a plda is mutatja, egy differencil tag stabill
tehet egy szablyozt, amely enlkl nem az.
A gyakorlatban a PD szablyoznak is lehetnek hibi. Van gy, hogy a PD szablyoz akkor sem tudja nullra
reduklni a hibt, ha a kls eltrts megsznik. Ez a pldnkbl nem nyilvnval, de nha szksg van egy
msik visszacsatolsra is az arnyoson fell, hogy a hibt meg lehessen szntetni. A megolds erre a problmra
egy harmadik tag hozzadsa a szablyozshoz, ami a hiba id szerinti integrljn alapul:
KI egy jabb erstsi tnyez. A kifejezs kiszmtja a hiba id szerinti integrljt. Ennek hatsra a
referenciajel s az aktulis llapot kztt hosszan fennll eltrs megsznik. Pldul ha xt hosszabb ideig
kisebb, mint y(t), akkor az integrl addig fog nni, amg az at el nem tnteti a hibt. Az integrtor biztostja,
hogy a szablyoznak ne legyen rendszeres hibja, azon az ron, hogy n az oszcillci veszlye. PID
szablyoznak (PID controller) hvjuk azt a szablyozt, amelyik mindhrom tagot tartalmazza. Szles krben
hasznljk klnbz ipari alkalmazsokhoz s irnytsi feladatokhoz.
6.2. Potenciltr-vezrls
A potenciltereket mint jabb kltsgfggvnyeket vezettk be a robotmozgs-tervezs sorn, de alkalmasak
arra is, hogy kzvetlenl generljk a robot mozgst, kiegsztve a plyatervezsi fzist. Ahhoz, hogy ezt
elrjk, definilnunk kell egy vonz ert, ami a robotot a clkonfigurci fel vonzza, valamint egy taszt
potencilteret, amely tvol tartja az akadlyoktl. Egy ilyen teret mr bemutattunk a 25.21. brn. Az egyetlen
819
Created by XMLmind XSL-FO Converter.
Robotika
globlis minimumhelye a clkonfigurci, rtke pedig az e cltl val tvolsg, valamint az akadlyok
kzelsgnek sszege. Az brn bemutatott potenciltr kialaktst nem elzte meg tervezs. ppen ezrt a
potencilterek jl alkalmazhatk vals idej megoldsokhoz. A 25.21. brn kt trajektria lthat, ahogy egy
robot kt klnbz kezdeti konfigurcibl megprblja megmszni a potencilteret. Nagyon sok alkalmazs
esetn a potencilteret hatkonyan ki lehet szmtani brmilyen adott konfigurci esetben. St adott
robotkonfigurci esetn a potencilok kialakulsval a potencilgradienst is meghatrozhatjuk. Ezek a
szmtsok ltalban klnsen hatkonyak, fleg a plyatervez algoritmusokhoz hasonltva, amelyek mind
exponencilisak a konfigurcis tr dimenzijban (a szabadsgfokokban).
Az a tny, hogy a potencilteres mdszer ilyen hatkonyan megtallja az utat a clhoz a konfigurcis trben
mg nagy tvolsgok esetn is, megkrdjelezi a tervezs szksgessgt. Vajon csak szerencsnk volt a
pldnk esetben, vagy tnyleg elegend a potencilterek hasznlata? A vlasz az, hogy szerencsnk volt. A
potenciltereknek szmos olyan loklis minimumhelye lehet, amely csapdba ejti a robotot. Ebben az esetben a
robot gy kzelti meg az akadlyt, hogy csak vllcsukljt mozgatja egszen addig, amg bele nem tkzik az
akadlyba a rossz oldalon. A potenciltr nem ad annyi informcit, hogy a robot behajltsa a knykt, hogy
tfrjen az akadly alatt. Ms szavakkal, a potenciltren alapul technikk nagyon jk loklis robotirnytsra,
de globlis tervezst ignyelnek. A msik htultje ennek a mdszernek az, hogy az erk, amiket generl, csak
az akadlyoktl s a cltl val tvolsgtl fggnek, nem veszik figyelembe a robot sebessgt. gy a
potenciltr-alap vezrls tnyleg egy kinematikai mdszer, s nem felttlenl mkdik, ha a robot gyorsan
mozog.
Robotika
25.22. bra - (a) Hexapod robot. (b) Kiterjesztett vges automata (KVA) (augmented
finite state machine, AFSM) egyetlen lb vezrlshez. Fontos, hogy ez a KVA-szenzoros
visszacsatolsra reagl: ha a lb megakad az elremozgats sorn, akkor magasabbra
emeli.
Mindazonltal a krnyezet explicit ismerete nlkl is lehetsges kzvetlenl szablyozt tervezni a feladathoz.
(Mr lttuk ezt a PD szablyoz esetben, amely kpes volt a komplex robotkart a megadott plyn tartani a
robot dinamikjnak pontos ismerete nlkl. Ugyanakkor szksg volt a kinematikai modell alapjn megalkotott
referenciaplyra.) A hatlb robot esetben megfelel absztrakcis szinten meglepen knny meghatrozni az
irnytsi trvnyt. A megfelel algoritmus ciklusosan mozgathatn a lbakat. Egy ideig a levegben mozognak,
utna pedig a fldn tmaszkodnak. A hat lbat gy kell koordinlni, hogy egyszerre hrom (ellenttes
oldalakon) mindig a fldn legyen, biztostva a robot fizikai stabilitst. Egy ilyen irnytsi algoritmust knny
programozni, s remekl mkdik sk felleten. Nehz terepen az egyes akadlyok meggtolhatjk a lbakat az
elremozdulsban. Ezen a problmn egy egszen egyszer irnytsi szabllyal segthetnk: ha a lb mozgst
valami blokkolja, a robot egyszeren hzza vissza, emelje magasabbra, s prblja jra! Az eredmnyl kapott
vezrlst, mint vges automatt mutatja a 25.22. (b) bra. Egy reflexszer genshez llapotokat trst, ahol a
bels llapot a gp aktulis llapotnak indexe (s1-tl s4-ig) jelli.
Ennek az egyszer visszacsatolson alapul szablyoznak a klnbz vltozatai figyelemre mltan robusztus
lpeget vezrlst valstanak meg, amellyel a robot grngys terepen is kpes elrejutni. Vilgos, hogy ehhez
a szablyozhoz nem kell krnyezeti modell, s nem kell semmifle keresst alkalmazni a vezrls
megalkotshoz. Amikor egy ilyen vezrlt hasznlunk, a robot viselkedsnek kialaktsban nagyon fontos
szerepet kapnak a krnyezetbl visszacsatolsknt rkez jelek. A szoftver magtl mg nem hatrozza meg,
hogy ppen mi fog trtnni a robottal, ha belehelyezik az adott krnyezetbe. Az olyan viselkedst, ami egy
(egyszer) szablyoz s a (komplex) krnyezet klcsnhatsaknt jn ltre kibontakoz viselkedsnek
(emergent behavior) hvjuk. Szigoran vve brmelyik eddig trgyalt robotra mondhatnnk, hogy kibontakoz
viselkedst mutat, hiszen egyetlen modell sem tkletes. Trtneti okok miatt azonban ezt a kifejezst csak arra
az irnytsi technikra mondjk, amelyik nem hasznl explicit krnyezeti modellt. A kibontakoz viselkeds
jellemz tulajdonsga szmos biolgiai organizmusnak is.
Technikailag a reaktv irnyts csak egy implementcija az MDF-ek (illetve ha vannak bels llapotok, akkor
POMDF-ek) stratgiinak. A 17. fejezetben szmos technikt ismertettnk, amelyek alkalmasak a robot
modelljbl s a robot krnyezetnek a modelljbl stratgik generlsra. A robotikban az ilyen stratgik
kzzel trtn megszerkesztsnek nagy gyakorlati jelentsge van, mivel kptelenek vagyunk tkletes
modelleket alkotni. A 21. fejezetben lert megerstses tanulsi mdszerek segtsgvel tapasztalati ton lehet
stratgikat szerkeszteni. Nhny ezen mdszerek kzl pldul a Q-tanuls s a stratgiakeres mdszerek
nem ignyel krnyezeti modellt, hanem a tanuls sorn sszegyjttt, nagy mennyisg adatra tmaszkodik. gy
alkalmas j minsg szablyozk ltrehozsra robotok szmra.
7. Szoftverarchitektrk a robotikban
Szoftverarchitektrnak (software architecture) hvjk az algoritmusok strukturlsnak mdszertant. Egy
architektra ltalban nyelveket s eszkzket tartalmaz programok rshoz, valamint egy tfog szisztmt,
amely alapjn a programokat ssze lehet illeszteni.
821
Created by XMLmind XSL-FO Converter.
Robotika
822
Created by XMLmind XSL-FO Converter.
Robotika
trtneti jelentsge ellenre ritkn szoktk kereskedelmi forgalomba kerl robotoknl hasznlni.
Ugyanakkor nhny leszrmazottjt mr igen.
Robotika
8. Alkalmazsi terletek
Most pedig felsorolunk nhnyat a robottechnolgia fontos alkalmazsi terletei kzl.
Ipar s mezgazdasg. Hagyomnyosan azok az gazatok hasznlnak robotokat, amelyek nehz, fizikai jelleg
emberi munkt ignyelnek, de mgis megfelelen strukturlhatk s automatizlhatk. A legjobb plda az
sszeszerel zemi gyrtsor, ahol a manipultorok rutinszeren vgzik feladatukat, az sszeszerelst, az
alkatrszek behelyezst, az anyagkezelst, a hegesztst s a festst. Sok esetben a robotok sokkal
kltsghatkonyabbak, mint a humn munkaer.
A szabadban sok nehz gp helyt robotok vettk t a betakartsnl, a bnyszatban, a fldmunkknl. Pldul
nemrgiben a Carnegie Mellonon, egy projekt sorn bemutattk, hogy a robotok 50-szer gyorsabban kpesek
levakarni a festket egy hajrl, mint az emberek, s sokkal kevesebb krt tesznek a krnyezetben. Autonm
bnyszrobotok prototpusai bizonytottk, hogy sokkal gyorsabban s pontosabban kpesek kitermelni az rcet
a fld alatti bnykban, mint az emberek. Robotokat hasznlnak az elhagyatott bnyk s csatornarendszerek
nagy pontossg feltrkpezshez is. Ugyan sok rendszer mg csak ksrleti stdiumban van, pusztn id
krdse, hogy a robotok mikor veszik t az emberektl a flig mechanikus munkk tbbsgt.
Szllts. A robotizlt szlltsnak sok oldala van. Az autonm helikopterektl kezdve, amelyek nehezen
megkzelthet helyekre juttathatnak el szlltmnyokat, az automata kerekes szkeken t (amik olyan
embereket szlltanak, akik nem tudnk irnytani a hagyomnyos kerekes szket), egszen az autonm
rakodgpekig, amelyek fellmljk a dokkokban a szakkpzett humn sofrt is a kontnerek hajkra s
teherautkra val bepakolsnl. J plda a beltri szllt robotokra a 25.23. (a) brn lthat Helpmate nev
robot. Ezt a robotot krhzak tucatjaiban hasznljk tel s egyb orvosi felszerels szlltsra. A kutatk olyan
autszer robotot is kifejlesztettek, amely kpes nllan naviglni az autplyn, s terepen is megllja a
helyt. zemi krlmnyek kztt a szlltrobotok ma mr rutinszeren ltjk el a szlltsi feladatokat
raktrakban s a gyrtsorok kztt.
Ezen robotok kzl sok ignyli, hogy munkja elvgzshez vltoztassunk valamit krnyezetn. A
leggyakoribb, hogy tjkozdst segt elemeket kell felszerelni, pldul induktv krket a padlba, aktv
fnyjeleket, vonalkdokat vagy GPS-adkat. Jelenleg mg mindig nagy kihvs olyan robotot tervezni, amely
kpes a termszetes krnyezetben tjkozdni, s nem ignyel mestersges eszkzket. Ez klnsen fontos
olyan esetekben, mint pldul a mlytengeri kutatsok, ahol a GPS nem elrhet.
824
Created by XMLmind XSL-FO Converter.
Robotika
25.23. bra - (a) A Helpmate robot lelmiszert s egyb orvosi felszerelst szllt tbb
tucat krhzban, vilgszerte. (b) Sebszrobotok a mtben (da Vinci Surgical Systems).
Egszsggy. A sebszorvosok munkjt segtend egyre tbbszr hasznlnak robotokat az orvosi eszkzk
pontos mozgatshoz olyan knyes szerveket rint mttek esetben, mint az agy, a szv vagy a szem. A 25.23.
(b) bra egy ilyen rendszert mutat be. A robotok nagy pontossguknak ksznheten nlklzhetetlen
eszkzkk vltak bizonyos cspprotzisek beltetsnl. Pilottanulmnyok kimutattk, hogy vgbltkrzs
esetn a robotizlt eszkzk hasznlata cskkenti a srls veszlyt. A mtn kvl, a kutatk megkezdtk
olyan robotok kifejlesztst, amelyek ids vagy fogyatkos emberek segtsgre lehetnek, mint pldul az
intelligens robotizlt jrgpek vagy intelligens jtkok, amelyek figyelmeztetnek a gygyszerek bevtelre.
Szemlyi kiszolglk. A szolgltats a robotok nagy, gretes alkalmazsi terlete. A szervizrobotok a
mindennapi teendk elvgzsben segdkeznek. A kereskedelmi forgalomban is kaphat szervizrobotok kztt
vannak autonm porszvk, fnyrk s golflabdaszedk. Ezen robotok mindegyike nllan, emberi segtsg
nlkl kpes naviglni, s teljesteni feladatt. Nhny szervizrobot nyilvnos helyeken tevkenykedik, mint
pldul az idegenvezetknt alkalmazott robotizlt informcis pult a bevsrlkzpontokban, a vsrokon vagy
a mzeumokban. A szervizfeladatok elltsa emberi interakcit kvn, s azt, hogy a robot megfelelen
boldoguljon kiszmthatatlan s dinamikus krnyezetekben.
25.24. bra - (a) Egy elhagyatott bnya feltrkpezse egy robottal. (b) A bnynak a
robot ltal kapott 3D kpe.
825
Created by XMLmind XSL-FO Converter.
Robotika
Szrakozs. A robotok megkezdtk a jtk- s szrakoztatipar meghdtst is. A 25.4. (b) brn mr
tallkoztunk a Sony AIBO-val, ami br kutyaszer jtk, vilgszerte hasznljk MI-kutatlaborokban klnbz
projektek platformjaknt. Az egyik, nagy kihvst jelent feladat, ahol az AIBO-kat fizikai eszkzknt
hasznltk, a robotfoci (robotic soccer): versengs kt csapat kztt, az emberi focihoz hasonl szablyokkal,
de autonm mobil robotokkal. A robotfoci nagyon j lehetsgeket knl az MI-kutatsokhoz, mert sok olyan
problmt foglal magban, ami mshol, komolyabb alkalmazsokban is megjelenik. Az vente megrendezsre
kerl robotfoci-bajnoksgok sok MI-kutatt vonzzanak, s rdekesebb, izgalmasabb tettk a robotiknak ezt
az gt.
Emberi kiegsztk. Az utols alkalmazs, amirl szt ejtnk, az emberi kiegsztk. A kutatk kifejlesztettek
mr a kerekes szkhez hasonl lpeget jrgpet, amelyek alkalmasak emberek szlltsra. Szmos helyen
jelenleg arra koncentrlnak, hogy olyan eszkzket alkossanak, amelyek megknnytik az embernek a jrst
vagy a karok mozgatst egy, a testhez kvlrl csatlakoztatott vzzal, amely kpes pluszert kifejteni. Ha
valakire tartsan rgztenek egy ilyen szerkezetet, akkor mestersges vgtagnak is tekinthet. A robotok ltali
tvjelenlt, illetve teleoperci is felfoghat emberi kiegsztsnek. A teleoperci azt jelenti, hogy robotikai
eszkzk segtsgvel nagy tvolsgbl tudunk megadott feladatokat vgrehajtani. A teleoperci npszer
megvalstsa a mesterszolga (master-slave) elv konfigurci, amikor is a robot manipultor a tvolban lv,
humn opertor mozdulatait kveti, egy heptikus (rzetet is kzvett) interfszen keresztl. Ezek a rendszerek
mind jobban kiterjesztik az emberi kpessgeket a krnyezettel val tkletesebb klcsnhats rdekben.
Nhny projekt azt tzte ki clul, hogy lemsolja az embert, legalbbis felletes szinten. Japnban mr szmos
cgnl kaphatk humanoid robotok.
9. sszefoglals
A robotika tulajdokppen nem ms, mint intelligens gensek, amelyek kpesek megvltoztatni a fizikai vilgot.
Ebben a fejezetben a kvetkez alapvet ismereteket sajttottuk el a robothardverrel s -szoftverrel
kapcsolatban.
A robotok szenzorokkal vannak felszerelve, hogy rzkelhessk az ket krlvev vilgot, s beavatkoz
szervekkel, hogy fizikai erkkel hathassanak krnyezetkre. A legtbb robot vagy manipultor, amely egy
adott helyhez van rgztve, vagy mobil robot, ami kpes mozogni.
A robotikai rzkels a dntshez kapcsold mennyisgeknek a szenzoros adatokbl val becslse. Ehhez
szksgnk van egy bels reprezentcira, valamint egy olyan mdszerre, amivel azt idnknt frissthetjk. A
nehz rzkelsi problmk gyakori pldi a helymeghatrozs s a trkpezs.
Valsznsg-alap szr algoritmusok, mint pldul a Kalman-szrk s a rszecskeszrk hasznosak a
robotrzkels szempontjbl. Ezek a technikk frisstik a bels vilgkpet, pldul az llapotvltozk a
posteriori eloszlst.
A robot mozgsnak tervezse ltalban a konfigurcis trben trtnik, ahol minden pont egyrtelmen
meghatrozza a robot egy adott pozcijt s orientcijt, csuklinak szgt.
A konfigurcis trben keres algoritmusok kztt fontos megemlteni a celladekompozcit, amely a teljes
konfigurcis teret vges sok cellra bontja fel, valamint a szkeletonizcis technikkat, amelyek az adott
826
Created by XMLmind XSL-FO Converter.
Robotika
konfigurcis teret egy alacsonyabb dimenziba vettik le. A mozgstervezs problmjt ezutn mr
egyszerbb struktrkban val keresssel is meg lehet oldani.
A keres algoritmus ltal megtallt plyn a robot akkor tud vgighaladni, ha egy PID szablyozt tesznk a
rendszerbe, aminek referenciaplyja a kvnt tvonal.
A potenciltr-alap technikk a cltl s az akadlyoktl val tvolsg szerint definilt potencilfggvnyek
segtsgvel navigljk a robotot. Ezek a technikk megakadhatnak loklis minimumhelyeken, de kpesek
mozgsgenerlsra elzetes tervezs nlkl.
Nha egyszerbb egy robotszablyozt kzvetlenl megtervezni, mint a plyt a krnyezet explicit
modelljbl levezetni. Egy ilyen szablyozt legtbbszr lerhatunk vges automataknt.
Az alrendelt architektra a programozk szmra lehetv teszi, hogy bels rajellel kiegsztett vges
automatk sszekapcsolsval robotvezrlket alkossanak.
A npszer hromrteg architektra olyan robotszoftver fejlesztshez is keretet ad, amely integrlja a
modellalap tervezst, a rszfeladatokra bontst s a szablyozst.
Lteznek feladatspecifikus robotprogramozsi nyelvek, amelyek megknnytik a robotszoftverek fejlesztst.
Ezek a nyelvek ksz szerkezetekkel segtik a tbbszl programok rst, a szablyozsi irnyelveknek a
tervezsbe trtn integrlst s a tapasztalatalap tanulst.
Robotika
A robottrkpezs gykerei kt klnbz helyrl erednek. Az egyik szl Smith s Cheeseman munkssgval
kezddtt (Smith s Cheeseman, 1986), akik Kalman-szrt alkalmaztak szimultn helymeghatrozsi s
trkpezsi problmkhoz. Az algoritmust elszr Moutarlier s Chatila implementlta 1989-ben, majd Leonard
s Durrant-Whyte terjesztettk ki (Leonard s Durrant-Whyte, 1992). Dissanayake s trsai 2001-ben rtk le az
gazat jelenlegi fejlettsgi szintjt (Dissanayake s trsai, 2001). A msik szl a foglalsi hlzat (occupancy
grid) reprezentci megalkotsval kezddtt, amelyet a valsznsgi trkpezsnl hasznlnak. A foglalsi
hlzat minden (x, y) pontra meghatrozza annak a valsznsgt, hogy ott egy akadly van (Moravec s Elfes,
1985). A modern robottrkpezsrl Thrun rt sszefoglalt (Thrun, 2002). Kuipers s Levitt (Kuipers s Levitt,
1988) az elsk kztt voltak, akik metrikus helyett topolgikus trkpezst javasoltak, az ember trbeli
tjkozdst vve alapul.
A korai mobil robot helymeghatrozsi technikkat Borenstein s trsai tekintettk t (Borenstein s trsai,
1996). Annak ellenre, hogy a Kalman-szr vtizedeken t jl ismert helymeghatrozsi mdszer volt az
irnytselmletben, a helymeghatrozs problmjhoz tartoz ltalnos valsznsgi szably csak jval
ksbb jelent meg az MI-irodalomban, Tom Dean s kollgi (Dean s trsai, 1990), valamint Simmons s
Koenig (Simmons s Koenig, 1995) munkssga rvn. Ez utbbi pros vezette be a Markovhelymeghatrozs (Markov localization) fogalmt. A technika els, valsvilg-beli alkalmazst Burgard s
trsai mutattk be (Burgard s trsai, 1999) egy sor roboton keresztl, amelyeket mzeumokba teleptettek. A
rszecskeszr-alap Monte Carlo helymeghatrozs, amelyet Fox s trsai fejlesztettk ki (Fox s trsai, 1999),
manapsg szles krben hasznlatos. A Rao-Blackwellized rszecskeszr kombinlja a rszecskeszrst a
robot lokalizcival, valamint az egzakt szrst a trkpalkotssal (Murphy s Russell, 2001; Montemerlo s
trsai, 2002).
A mobil robotokhoz kapcsold kutatsok szimullsnak az elmlt vtizedben kt jelents verseny is teret
adott. Az AAAI ves robotbajnoksgt 1992 ta rendezik meg. Az els verseny gyztese a CARMEL volt
(Congdon s trsai, 1992). A fejlds azta igen jelents s tretlen: a 2002-es verseny sorn pldul a
robotoknak be kellett jrniuk a konferenciakzpontot, megtallni a regisztrcis pultot, regisztrlni a
konferencira, s vgl tartani egy beszdet. Az 1995-ben, Kitano s kollgi (Kitano s trsai, 1997) ltal
elindtott Robocup kezdemnyezs clja, hogy 2050-re olyan teljesen autonm humanoid robotokbl ll
futballcsapatot fejlesszen, amely kpes megverni az aktulis emberi vilgbajnokcsapatot. Klnbz
bajnoksgokat szerveznek kerekes, eltr mret, szimullt robotoknak s ngylb Sony Aibknak. 2002-ben a
vilgbajnoksgra tbb mint 30 orszgbl rkeztek csapatok, s a rendezvny legalbb 100 000 nzt vonzott.
A robotmanipultorok, eredeti nevkn kzszem gpek (hand-eye machine) tanulmnyozsa meglehetsen
ms vonalon fejldtt. Egy ilyen kzszem gp megalkotsra az els igazi ksrlet Heinrich Ernst MH-1-ese
volt, amelyet PhD-tziseiben rt le az MIT-n (Ernst, 1961). Az edinburghi Gpi Intelligencia (Machine
Intelligence) program mr igen korn jelents eredmnyeket mutatott fel ltsalap sszeszerel rendszerkkel,
amit FREDDY-nek hvtak (Michie, 1972). Ezen ttr ksrletek utn rengetegen foglalkoztak geometriai
algoritmusokkal determinisztikus s teljesen megfigyelhet mozgstervezsi problmkhoz. A robotmozgstervezs P-TR nehzsgt Reif egy termkenyt cikke mutatta be (Reif, 1979). A konfigurcistrreprezentcit Lozano-Perez-nek (Lozano-Perez, 1983) ksznhetjk. Nagy befolyst gyakoroltak Schwartz s
Sharir publikcii az ltaluk zongoraszlltknak (piano movers) nevezett problmrl (Schwartz s trsai,
1987).
A konfigurcis tr rekurzv cellkra bontsval val tervezs Brookstl s Lozano-Perez-tl szrmazik (Brooks
s Lozano-Perez, 1985), ezt ksbb Zhu s Latombe fejlesztettk jelentsen tovbb (Zhu s Latombe, 1991). A
legkorbbi szkeletonizcis algoritmusok a Voronoi-diagramokon (Rowat, 1979) s a lthatsgi grfokon
(visibility graph) alapultak (Wesley s Lozano-Perez, 1979). Guibas s trsai (Guibas s trsai, 1992) hatkony
technikt fejlesztettek ki a Voronoi-diagramok inkrementlis szmtsra. Choset (Choset, 1996) ltalnostotta
sokkal tfogbb mozgstervezsi problmkra a Voronoi-diagramokat. John Canny alapozta meg PhD-tzisvel
(Canny, 1991) az els klnll exponencilis algoritmust plyatervezsre. Msfle szkeletonizcis mdszert
hasznlt, amit sziluett (silhouette) algoritmusnak hvnak. Jean-Claude Latombe rsa (Latombe, 1991) a
klnbz mozgstervezsi metdusok szles skljt fedi le. Kavraki s trsai valsznsgi titervet
fejlesztettek (Kavraki s trsai, 1991), amely mg ma is a leghatkonyabb. Lozano-Perez s trsai (LozanoPerez s trsai, 1984), valamint Canny s Reif (Canny s Reif, 1987) is foglalkoztak a finom mozgsok
tervezsvel korltozott rzkels esetn, s intervallumra vonatkoztatott bizonytalansgot hasznltak
valsznsgi bizonytalansg helyett. A referenciapont-alap navigls a mobil robotok esetben sok hasonl
tletet hasznl (Lazanas s Latombe, 1992).
A robotok mint dinamikus rendszerek irnytsa, legyen sz manipultorrl vagy mobil robotrl, hatalmas
irodalommal rendelkezik, amelynek anyagrl ebben a fejezetben alig-alig esett sz. A fontos mvek kz
828
Created by XMLmind XSL-FO Converter.
Robotika
tartozik Hogan trilgija (Hogan, 1985) az impedancia szablyozsrl s egy ltalnos tanulmny a robotok
dinamikjrl Featherstone-tl (Featherstone, 1987). Dean s Wellman az elsk kztt voltak, akik
megprbltk sszektni az irnytselmletet s az MI-tervezrendszereket (Dean s Wellman, 1991). Hrom
klasszikus tanknyv a robotkarok matematikjrl Paultl (Paul, 1981), Craigtl (Craig, 1989) s Yoshikawtl
(Yoshikawa, 1990) szrmazik. A megfogs (grasping) trgykre szintn nagyon fontos a robotikban: egy
stabil megfogs meghatrozsnak problmja meglehetsen nehz (Mason s Salisbury, 1985). A megfelel
megfogs rintkezsrzkelket vagy heptikus visszacsatolst (haptic feedback) kvn a fellp erk s az
esetleges csszs meghatrozsra (Fearing s Hollerbach, 1985).
A potenciltr-vezrlst, amely egyszerre prblja megoldani a mozgstervezs s az irnyts problmjt,
Khatib vezette be a robotika irodalmba (Khatib, 1986). Mobil robotok esetben ezt az tletet rszleges
megoldsnak tekintettk az tkzsek elkerlsnek problmjhoz. Ksbb Borenstein (Borenstein, 1991)
tovbbfejlesztette az algoritmust, s a vektortrhisztogram (vector field histogram) nevet adta neki. A
navigcis fggvnyeket, a determinisztikus MDF-hez tartoz vezrlsi irnyelvek robotikai megfeleljt,
Koditschek vezette be (Koditschek, 1987).
A robotokhoz tartoz szoftverarchitektra tmja sok heves vitt vltott ki. Az MI j reg zszlshajja a
hromrteg architektra Shakey tervezsnek eredmnye, ksbb Gat jtotta fel (Gat, 1998). Az alrendelt
architektra Brooks munkja (Brooks, 1986), br tlk fggetlenl Braitenberg (Braitenberg, 1984) is fejlesztett
hasonlt, akinek knyve, a Jrmvek, egy sor egyszer viselkedsalap robotot mutat be. Brooks hatlb
lpeget robotjnak sikert sok ms projekt kvette. Connell PhD-munkja keretben (Connell, 1989) olyan
teljesen reaktv mobil robotot fejlesztett, amely kpes volt trgyakrt elmenni s azokat elhozni. A
viselkedsalap paradigma tbbrobotos rendszerekre val kiterjesztst megtallhatjuk Mataric (Mataric, 1997)
s Parker (Parker, 1996) munkiban. A GLR (Horswill, 2000) s a COLBERT (Konolige, 1997) robotok
megvalstottk a prhuzamostott viselkedsalap irnytst ltalnos robotprogramozsi nyelveken. Arkin
tfog kpet nyjtott a tma aktulis helyzetrl (Arkin, 1998).
A 7. fejezetben lert helyezett automatkat (situated automata) (Rosenschein, 1985; Kaelbling s
Rosenschein, 1990) szintn hasznljk mobil robotok irnytsra, feldertsi s szlltsi feladatoknl. A
helyezett automatk szorosan kapcsoldnak a viselkedsalap tervezshez abbl a szempontbl, hogy vges
automatkbl llnak, amelyek egyszer kombincis hlzatokkal nyomon kvetik a krnyezet llapotnak
bizonyos aspektusait. Amg a viselkedsalap megkzelts az explicit reprezentci hinyt hangslyozza, a
helyezett automatkat algoritmikusan ptik deklaratv krnyezeti modellekbl, gy minden llapotregiszter ltal
reprezentlt tartalom jl definilt.
Szmos j kziknyv jelent meg mostanban a mobil robotokrl. A fent emltetteken fell Kortenkamp s trsai
(Kortenkamp s trsai, 1998) gyjtse minden rszletre kiterjed ttekintst nyjt a mai mobil robot
architektrkrl s rendszerekrl. Kt jabb knyv, Dudek s Jenkin (Dudek s Jenkin, 2000), valamint Murphy
(Murphy, 2000) munkja ltalnosabb megkzeltsben trgyalja a robotikt. Mason knyve (Mason, 2001) a
robotkarokrl olyan modern tmkat is trgyal, mint pldul az nbell mozgs. A robotikval foglalkoz
legjelentsebb konferencia az IEEE International Conference on Robotics and Automation. A tmval
foglalkoz folyiratok kzl kiemelkedik az IEEE Robotics and Automation, az International Journal of
Robotics Research s a Robotics and Autonomous Systems.
9.2. Feladatok
25.1.
A Monte Carlo-helymeghatrozs torztott brmilyen vges mret mintra. Azaz az algoritmus ltal kiszmolt
vrhat rtk a rszecskeszrs mkdsbl addan eltr a tnyleges vrhat rtktl. Ebben a pldban ezt a
torztst kell kiszmolni.
Hogy kicsit egyszerstsk a problmt, vegynk egy teret, amelyben a robotnak ngy lehetsges llapota
(helyzete) van: X = {x1, x2, x3, x4}. Kezdetben egyenletes eloszlssal vlasztunk N 1 mintt a megadott
llapotok kzl. Mint ltalban, itt is tkletesen elfogadhat, ha egyms utn akr tbb is generldik
brmelyik X llapotbl. Legyen Z egy binris szenzorvltoz, az albbi feltteles valsznsgekkel:
P(z|x1)
0,8
= P(z|x1) = 0,2
829
Created by XMLmind XSL-FO Converter.
Robotika
P(z|x2)
0,4
= P(z|x2) = 0,6
P(z|x3)
0,1
= P(z|x3) = 0,9
P(z|x4)
0,1
= P(z|x4) = 0,9
830
Created by XMLmind XSL-FO Converter.
Robotika
a. Vegyk a 25.25. (a)-tl (c)-ig lthat robotkonfigurcikat, nem vve figyelembe a diagramokon feltntetett
akadlyokat. Rajzolja fel az ezeknek megfelel robotkar-konfigurcikat a konfigurcis trben. (Segtsg:
minden egyes karkonfigurci egyetlen pontra kpzdik le a konfigurcis trben, ahogy ezt a 25.12. (b) bra
is mutatja.)
b. Rajzolja meg a konfigurcis teret a 25.25. (a)(c) brkon lthat minden egyes munkatrdiagramra.
(Segtsg: a konfigurcis terek megegyeznek a 25.25. (a) brn lvvel, ami a robot nmagval val
tkzst jelent terletet illeti, de klnbsgek addnak a terlet hatrt jelent akadlyok hinybl s az
egyes brkon lv akadlyok klnbz helyzetbl.)
c. A 25.25. (e)(f) brkon lthat fekete pontok mindegyikhez rajzolja meg a hozz tartoz konfigurcit a
munkatrben. Az rnykolt rszeket hagyja figyelmen kvl.
d. A 25.25. (e)(f) brkon lthat konfigurcis terek mindegyikt egy-egy klnll (a munkatrben lv)
akadly generlta (ez a sttebb terlet), valamint azok a megszortsok, amelyek a robot nmagval val
tkzsbl erednek (a vilgosabb rnyalat). Rajzolja meg mindkt diagramhoz a stt terletnek megfelel
akadlyt a munkatrben.
e. A 25.25. (d) bra azt mutatja be, hogy egyetlen skbeli (lapos) akadly kt elvlasztott rszre tudja bontani a
konfigurcis teret. Maximum hny elvlasztott rszre tudja bontani az egybefgg akadlymentes teret
egyetlen lapos akadly behelyezse egy 2 szabadsgfokos robot esetn? Adjon pldt r, s indokolja meg,
mirt nem lehetsges nagyobb szm fggetlen terlet kialaktsa. Mi a helyzet, ha nem lapos az akadly?
25.6.
Vegyk a 25.26. bra egyszerstett robotjt. Tegyk fel, hogy a robot derkszg koordinti ismertek minden
idpillanatban, mint ahogy a clhelyzet is. Ugyanakkor van egy akadly, amelynek a helyzete nem ismert. A
robot csak a kzvetlen krnyezetben kpes rzkelni az akadlyt, mint ahogy azt az bra is illusztrlja. Az
egyszersg kedvrt ttelezzk fel, hogy a robot mozgsa zajjal nem terhelt, s az llapottr diszkrt. A 25.26.
bra csak egy plda. Ebben a feladatban azt krjk, hogy minden lehetsges rcsvilgra gondoljon, ahol van
rvnyes t a start pozcitl a clig.
831
Created by XMLmind XSL-FO Converter.
Robotika
a. Tervezzen egy modellalap vezrlt, amely garantlja, hogy a robot mindig elri a clt, amennyiben ez
lehetsges. A modellalap vezrl egy, a mozgs sorn fokozatosan kialaktott trkp formjban kpes
trolni a terep jellemzit. A robot az egyes mozdulatok kztt tetszleges idt tlthet gondolkodssal.
b. Most pedig tervezzen egy reaktv vezrlt ugyanerre a feladatra. Ez a vezrl nem trolhatja a korbbi
rzkelsek eredmnyeit. (Azaz nem kszthet trkpet!) Ehelyett minden dntst az aktulis rzkel adatai
alapjn hozza meg, amely magban foglalja a sajt helynek s a cl pontos helyzetnek ismerett. A
dntshozsi idnek fggetlennek kell lennie a krnyezet mrettl, valamint a mr megtett lpsek
szmtl. Maximum hny lps kell a robotnak ahhoz, hogy elrje cljt?
c. Hogy fog viselkedni az (a) s (b) pontban megtervezett vezrl, ha az albbi hat felttel valamelyike fennll:
folytonos llapottr; zajjal terhelt rzkels; zaj a mozgsban; zaj mind a mozgsban, mind az rzkelsben; a
cl helyzete ismeretlen (csak akkor ismeri fel a clt, ha az az rzkel hattvolsgn bellre kerl); vagy
mozg akadlyok vannak. Minden egyes felttelre s mindkt vezrlre adjon egy-egy pldt, amikor is a
robot elbukik (vagy magyarzza el, mirt nem tud).
25.7.
A 25.22. (b) brn kiterjesztett vges automatt hasznltunk a hatlb robot egyetlen lbnak vezrlshez.
Ebben a feladatban a cl egy olyan AFSM tervezse, amely a hat kln lbhoz tartoz vezrlvel
egyttmkdve hatkony s stabil mozgst eredmnyez. Ennek elrshez ki kell bvteni az egyes lbakat
vezrl AFSM-eket, hogy zeneteket is kldjenek az j AFSM-nek, s hogy vrjanak amg ms zenetek
rkeznek. Magyarzza el, hogy mirt hatkony a vezrlje, azaz mirt nem fogyaszt feleslegesen energit (pl.
cssz lbak miatt), s hogy mirt mozgatja a robotot megfelelen nagy sebessggel! Bizonytsa be, hogy
vezrlje megfelel a 25.2. alfejezetben tmasztott stabilitsi feltteleknek.
25.8.
(Ezt a feladatot Michael Genesereth s Nils Nilsson talltk ki, s az els vesektl a vgzskig mindenkinek
szl.) Az emberek annyira gyesek alapfeladatok elvgzsben mint pldul csszk felemelse vagy dobozok
egymsra raksa , hogy gyakran elfelejtik milyen sszetettek ezek a mozdulatok valjban. A feladat sorn
felfedezzk e feladatok komplexitst, s sszefoglaljuk a robotika elmlt 30 vnek fejldst. Elszr
hatrozzuk meg a feladatot (pldul egy kapu ksztse hrom dobozbl), majd ptsnk egy robotot ngy
emberbl az albbiak szerint:
Agy: az Agy feladata a cl elrst biztost terv kidolgozsa s a kezek irnytsa a terv megvalstsa sorn.
Az Agy informcit csak a Szemtl kaphat, kzvetlenl nem lthatja a helysznt! Az Agy az egyetlen, aki
tudja, mi a cl.
Szem: a Szem feladata a helyszn rvid lersa az Agy szmra. A munkakrnyezettl kb. egy mternyire kell
lennie, s vagy kvalitatv lerst (mint pldul: Az oldaln fekv zld doboz tetejn egy piros doboz van),
832
Created by XMLmind XSL-FO Converter.
Robotika
vagy kvantitatv lerst (A zld doboz kb. 50 cm tvolsgra balra van a kk hengertl) adhat. A Szem az
Agytl jv krdsekre is vlaszolhat, gy pldul: Van-e hely a Bal Kezem s a piros doboz kztt? Ha
van kznl egy videokamera, akkor lltsuk r a munkakrnyezetre, s a Szem ezen keresztl nzze azt, ne
lssa kzvetlenl!
Kezek (Jobb s Bal): mindkt Kezet ms ember jtssza. A kt Kz egyms mellett ll. A Balkz csak a sajt
balkezt hasznlja, a Jobbkz pedig csak a jobbat. A Kezek csak egyszer, az Agytl rkez feladatokat
hajthatnak vgre. Pldul: A Balkz mozduljon 5 cm-t elre. Csak mozgsparancsot kpesek vgrehajtani
pldul a vedd fel a dobozt nem olyan parancs, amit a Kz vgre tud hajtani. A csalsok megakadlyozsa
vgett megkvetelhetjk, hogy a kezeken legyen keszty vagy hasznljanak csipeszt. A Kezeknek bekttt
szemmel kell tevkenykednik. Egyetlen rzkelsi kpessgk az, hogy meg tudjk mondani, amikor tjukat
valamilyen elmozdthatatlan akadly, pldul egy asztal vagy a msik Kz zrja el. Ilyen esetben hangjelzst
adhatnak az Agy informlsa cljbl.
833
Created by XMLmind XSL-FO Converter.
834
Created by XMLmind XSL-FO Converter.
Filozfiai alapok
helyvltoztats mdjt.2 A gondolkod gpek gyakorlati lehetsge mg csak mintegy tven ve jelent meg,
s ez az id nem volt elg az angolul beszlknek, hogy a gondolkodni sz az angolban j jelentst kapjon.
Alan Turing azt javasolta Computing Machinery and Intelligence c. hres cikkben (Turing, 1950), hogy ne azt
krdezzk, tudnak-e a gpek gondolkodni, hanem azt vizsgljuk, hogy tmennek-e a gpek egy viselkedsi
intelligenciateszten, amelyet ksbb Turing-tesztnek neveztek el. A teszt szerint a programnak t percen t kell
(gpelt online zenetekkel) beszlgetnie egy krdezvel. A krdeznek ezutn vlasztania kell, hogy egy
programmal vagy egy szemllyel beszlgetett-e, s egy program akkor felel meg a teszten, ha az id 30%-ban
megtveszti a krdezt. Turing azt a sejtst fogalmazta meg, hogy 2000-re egy 109 tregysgbl ll
szmtgpet be lehet gy programozni, hogy megfeleljen a teszten, mde nem lett igaza. Az ugyan megtrtnt
mr, hogy nhny embert t percig becsaptak; pldul az ELIZA program s az MGONZ internetes csevegrobot
becsapott olyan embereket, akik nem gondoltak arra, hogy taln egy programmal beszlhetnek, s az ALICE
program becsapott egy zsritagot a 2001-es Loebner-djrt zajl versenyben. De egyetlenegy program sem
kerlt annak kzelbe, hogy 30%-ot rjen el kpzett zsrivel szemben, s az MI-kutats egsze nem is szentel
tl nagy figyelmet a Turing-teszteknek.
Turing az intelligens gpek lehetsge ellen felhozhat rvek szles vlasztkt is megvizsglta, belertve szinte
minden olyan ellenrvet, amely a cikk megjelense ta eltelt fl vszzadban felmerlt. A kvetkezkben ezek
kzl nznk meg nhnyat.
835
Created by XMLmind XSL-FO Converter.
Filozfiai alapok
tanstannak az ilyen dolgok vgrehajtsakor: ezek nem rszei viselkedsknek (errl a krdsrl majd mshol
beszlnk), hanem inkbb arrl van sz, hogy gyakran tves az els felttelezsnk az adott tevkenysg
elvgzshez szksges mentlis folyamatrl. Ugyanakkor az is igaz, hogy szmtalan feladatban a szmtgpek
(finoman szlva) nem jrnak az len, s ilyen Turing feladata, a nyltvg beszlgetsek folytatsa is.
836
Created by XMLmind XSL-FO Converter.
Filozfiai alapok
Filozfiai alapok
3. A tanul algoritmusok nem teljestenek jl sok jellemz esetn, viszont ha kijelljk a jellemzk egy
halmazt, nem ismeretes olyan mdszer, amellyel j jellemzket illeszthetnk be, ha a jelenlegiek nem
lennnek elegendk a megtanult tnyekhez, valjban j eljrsok, mint pldul a szupport vektor gpek, jl
megbirkznak a nagy jellemzhalmazokkal is. A 19. fejezetben pedig lthattuk, hogy alapjaikat tekintve
lteznek mdszerek az j jellemzk bevezetsre, habr mg sok tennival akad ezen a terleten.
4. Az agy kpes a szenzorait relevns informcik keressre irnytani, s kpes kinyerni az informcikbl
azt, ami relevns az adott szituciban. Ezzel szemben jelenleg egyetlen rszlett sem rtjk ennek a
mkdsmdnak lltjk , s mg csak olyan hipotzist sem tudunk alkotni rluk, amely tmutatsul
szolglhatna az MI-kutatknak. Valjban az aktv lts terlete, amelyet az informcirtk-elmlet (lsd
16. fejezet) alapoz meg, ppen hogy a szenzorok irnytsnak problmjval foglalkozik, s az elrt elmleti
eredmnyek egy rszt mr t is ltettk robotmegvalstsokba.
sszegezve azt mondhatjuk, hogy szmos olyan krds, melyet Dreyfus felvetett a kznapi httrtuds, a
kvalifikci problma, a bizonytalansg kezelse, a tanuls, a dntshozatal elre lefordtott mdjai, annak
fontossga, hogy ne testetlen kvetkeztetgpeket tekintsnk, hanem szitucijukba gyazott genseket , ma
mr bekerlt az intelligens gensek tervezsnek szokvnyos menetbe. Vlemnynk szerint mindez teht nem
a mestersges intelligencia lehetetlensgt, hanem ppen a fejldst bizonytja.
838
Created by XMLmind XSL-FO Converter.
Filozfiai alapok
lenne az sszehasonlts.
GP: Nem hiszem, hogy ezt komolyan gondolod. A tli nap alatt egy tlagos tli napot szoks
839
Created by XMLmind XSL-FO Converter.
Filozfiai alapok
nem mond semmit arrl, hogy a neuronok mirt rendelkeznek ilyen kauzlis ervel, s arrl sem, hogy ms
fizikai megtesteslsek rendelkezhetnek-e ezekkel az erkkel.
A kt llspont megvizsglshoz vegyk szemgyre elszr az elmefilozfia legrgibb problmjt, majd
pedig hrom gondolatksrletet.
Esetleg a sznatom ms izotpjra, ahogyan ez az agyi kpalkot vizsglatok sorn gyakran trtnik.
840
Created by XMLmind XSL-FO Converter.
Filozfiai alapok
nvekedjen s fejldjn. Ugyanakkor azonban egy teljessggel kitallt vilg szmtgpes szimulcijnak
elektromos ingereit vezetik az agyba, az agy motorikus ingereit pedig elfogjk, s hatsukra megfelelen
mdostjk a szimulcit.4 Ekkor az agy rendelkezhet a HallosanVgyik(n, Hamburger) mentlis llapottal,
akkor is, ha nincs is teste, amely az hsget rezn, zlelbimbi sincsenek, st taln egyltaln nincs is
hamburger a valdi vilgban. Azonosnak tekintjk-e ezt a mentlis llapotot egy testben lv agy megfelel
mentlis llapotval?
Az egyik kit a dilemmbl annak megllaptsa, hogy a mentlis llapotok tartalma kt klnbz
szempontbl rtelmezhet. A tg tartalom (wide content) nzet kpviseli a mentlis llapotok tartalmt a
mindentud kls megfigyel szemszgbl rtelmezik, amely megfigyel tltja az egsz szitucit, s
felismeri a vilg klnbsgeit. Teht a tg tartalom nzet szerint a tartlyba helyezett agy vlekedsei
klnbzk a norml szemly vlekedseitl. A szk tartalom (narrow content) nzet szerint viszont csak a
bels, szubjektv nzpontot kell figyelembe venni, s szerintk a kt vlekeds megegyezik.
Annak a vlekedsnek, hogy a hamburger zletes, bens termszete van: van valami, amihez az ilyen vlekeds
hasonlt. Most mr belptnk a qualik, a bens lmnyek birodalmba (a qualia sz a latin nyelvbl
szrmazik, megkzelt jelentse: ilyen dolgok). Tegyk fel, hogy a retina s az idegrendszer valamilyen
srlse folytn X szemly gy rzkeli a vrs sznt, mint Y a zldet, s vice versa. Ebben az esetben ugyangy
ltjk a kzlekedsi lmpt, s ugyangy is cselekszenek, de tapasztalataik valamikppen klnbzni fognak.
Mindketten elfogadhatjk, hogy tapasztalatuk neve: a lmpa vrs, de tapasztalatuk klnbz rzs lesz.
Nem vilgos, hogy mit jelent ez a mentlis llapotok megegyezst illeten. A kvetkezkben egy olyan
gondolatksrlettel foglalkozunk, amely azt vizsglja, hogy az emberi neuronokon kvl ms fizikai trgyaknak
is lehetnek-e mentlis llapotai.
2.3. Az agyprotzis-ksrlet
Az agyprotzis-ksrletet Clark Glymour vezette be a hetvenes vek kzepn, majd John Searle (Searle, 1980) is
finomtott rajta, de manapsg leginkbb Hans Moravec (Moravec, 1988) munkssgval szoks sszefggsbe
hozni. A ksrlet a kvetkez. Tegyk fel, hogy a neurofiziolgia eljutott odig, hogy tkletesen megrtette az
emberi agy sszes neuronjnak bemenetikimeneti jellemzit s sszekapcsoldst. Tegyk fel tovbb azt is,
hogy kpesek vagyunk olyan mikroszkopikus mret elektronikus berendezseket pteni, amelyek utnozni
tudjk ezeket a jellemzket, s problmamentesen hozzilleszthetk az idegszvethez. Vgl pedig tegyk fel
azt is, hogy valamilyen csodlatos sebszi technikval anlkl tudjuk az egyes neuronokat a megfelel
elektronikus eszkzkkel helyettesteni, hogy az agy egszben vett mkdse megszakadna. A ksrlet abbl
ll, hogy valaki fejben az sszes neuront elektronikus eszkzkkel helyettestik, majd pedig a folyamat
visszafordtsval visszajuttatjuk az illett a normlis biolgiai llapotba.
A szemlynek mind a mtt sorn tanstott kls viselkedse, mind bels tapasztalatai rdekelnek minket. A
ksrlet alanynak kls viselkedsnek definci szerint vltozatlannak kell maradnia az operci nlkl
megfigyelhet viselkedshez kpest.5 A ksrlet alanynak azonban egyben kpesnek kell lennie arra, hogy
noha a tudatossg hinyt vagy jelenltt egy harmadik szemly nehezen llapthatja meg beszmolt adjon a
tudatos tapasztalatt rt vltozsokrl. A trtntekre vonatkoz klnbz intuciink nyilvn ellentmondanak
egymsnak. Moravec szerint, aki robotkutat s funkcionalista, vltozatlan maradna a tudata. A filozfus s
biolgiai naturalista Searle azonban ugyanilyen ersen vallja, hogy a tudata eltnne:
Azt fogod szrevenni legnagyobb megdbbensedre , hogy a kls viselkedsed irnytsa
mintegy kicsszik a kezeid kzl. Azt veszed szre, hogy pldul amikor az orvosok
vizsgljk a ltsodat, hallod ket, amint azt mondjk: Egy piros trgyat tartunk n eltt,
krjk, mondja el, mit lt. Ez a kilts trne ki belled: Semmit sem ltok. Teljesen
megvakulok. De hallod a sajt hangodat, amint befolysodtl teljesen fggetlenl ezt
mondja: Egy vrs trgyat ltok magam eltt. () Tudatos tapasztalatod lassan semmiv
zsugorodik, de a kls, megfigyelhet viselkedsed vltozatlan marad.
(Searle, 1992)
Mindannyian csak intucink alapjn tudunk rvelni. Elszr vegyk szre, ahhoz, hogy a kls viselkeds
vltozatlan maradjon, mialatt a ksrlet alanya fokozatosan elveszti a tudatt, az akaratnak egyik pillanatrl a
msikra hirtelen s teljesen kell eltnnie; klnben a tudat zsugorodsa befolysoln a kls viselkedst
pldul ilyesmi szavak hangzannak el: Segtsg, eltnben vagyok! Elg valszntlenl hangzik azonban,
4
5
Ez a helyzet ismers lehet azoknak, akik lttk az 1999-ben kszlt Mtrix (The Matrix) c. filmet.
El tudunk kpzelni egy azonos kontrollszemlyt, akin egy placeboopercit hajtanak vgre, hogy a kt viselkedst sszevethessk.
841
Created by XMLmind XSL-FO Converter.
Filozfiai alapok
hogy a neuronok egyenknti lecserlse az akarat hirtelen, egyik lpsrl a msikra trtn teljes eltnshez
vezetne.
Msodszor pedig nzzk meg, mi trtnik akkor, ha a ksrlet alanyt az alatt az id alatt krdezzk tudatos
tapasztalatairl, amikor egyetlen igazi neuron sincs jelen az agyban. A ksrlet felttele szerint olyasfle
vlaszokat kell kapnunk, mint Jl rzem magam. Meg kell mondanom, egy kicsit meg vagyok lepdve, hiszen
elhittem, amit Searle mondott. Vagy pedig egy mutatplcval egy kicsit megszrhatjuk a ksrleti alanyt s
megfigyelhetjk vlaszt: Juj, ez fj. Viszont norml krlmnyek kztt a mestersges intelligencia
programok ilyen kimeneteit a szkeptikus elutasthatja, mint egyszer ltszatvlaszokat. Hiszen elg knny
elkpzelni egy olyan szablyt, mint pldul: Ha a 12-es szenzoron Magas rtk jelenik meg, adj ki Juj!-t.
A lnyeg azonban az, hogy mivel a norml emberi agy sszes funkcionlis tulajdonsgt tmsoltuk,
felttelezhetjk, hogy elektronikus agyunk nem tartalmaz ilyen ltszatvlasz-mechanizmusokat. Azaz az
elektronikus agy ltal ltrehozott tudati megnyilvnulsokra olyan magyarzatot kell adnunk, amely csak a
neuronok funkcionlis tulajdonsgaira hivatkozik. Ennek a magyarzatnak azonban a vals agyra is
vonatkoznia kell, amelynek ugyanazok a funkcionlis tulajdonsgai. Ezrt, gy tnik, ktfajta konklzi
lehetsges.
1. A tudat kauzlis mechanizmusai, amelyek ezt a kimenetet a normlis agyban ltrehozzk, ugyangy
mkdnek az elektronikus vltozatban is, amely teht tudatos.
2. A normlis agy tudatos mentlis esemnyeinek semmilyen kapcsolata nincs a viselkedssel, valamint
nincsenek is jelen ezek az esemnyek az elektronikus agyban, amely teht nem tudatos.
A msodik lehetsget ugyan nem zrhatjuk ki, de ez arra redukln a tudatot, amit a filozfusok
epifenomenlis (epiphenomenal) szereplnek neveznek: valami: ami megtrtnik ugyan, de mintha nem is
vetne rnykot a megfigyelhet vilgban. Valamint ha a tudat tnyleg epifenomn, akkor az agyban lennie kell
egy msodik, nem tudatos mechanizmusnak, amelyhez a Juj! tartozik.
Harmadszor pedig tekintsk az operci visszacsinlsa utni helyzetet, amikor a ksrlet alanynak ismt
normlis agya van. Emlkezznk arra, hogy a definci szerint a ksrleti alany kls viselkedsnek olyannak
kell lennie, mintha az operci nem is trtnt volna meg. Ennek specilis eseteknt fel kell tudnunk tenni azt a
krdst: Milyen volt az operci alatt? Emlkszik a mutatplcra? A ksrleti alanynak pontos
emlknyomokkal kell rendelkeznie a tudatos tapasztalatai tnyleges termszetrl, belertve a qualit is;
mindannak ellenre, hogy Searle szerint nem is voltak ilyen tapasztalatai.
Searle taln azzal vlaszolna, hogy nem jl definiltuk a ksrletet. Ha a valdi neuronokat visszahelyezskkor
gy keltjk letre, ami az eltvoltsuk ta eltelt idt nem tkrzi, akkor termszetesen nem fognak emlkezni
az operci alatti tapasztalatokra. Hogy erre az eshetsgre is felkszljnk, a visszahelyezskor a mestersges
neuronok bels llapotnak megfelelen mdostanunk kell az ket helyettest neuronok llapott. Ha a valdi
neuronok felttelezett nem funkcionlis aspektusai ekkor egy olyan viselkedst eredmnyeznnek, amely
funkcionlisan klnbzik attl, mint amely a mestersges neuronok bent hagysval megfigyelhet lenne,
akkor reductio ad absurdumhoz jutnnk, mert ez azt jelenti, hogy a mestersges neuronok funkcionlisan nem
ekvivalensek a valdi neuronokkal. (A 26.3. feladat egy lehetsges utat mutat ezen rv cfolatra.)
Patricia Churchland (Churchland, 1986) rmutat arra, hogy ha a funkcionalista rv mkdik a neuronok szintjn,
akkor mkdnie kell brmely nagyobb funkcionlis egysg szintjn is, legyen az akr neuronok egy halmaza,
egy mentlis modul, egy lebeny, egy agyflteke vagy akr az egsz agy. Ezek szerint, ha elfogadjuk, hogy az
agyprotzis ksrlet tanulsga a tudat megmaradsa az agy kicserlse sorn, akkor azt is el kell fogadnunk,
hogy a tudat akkor is megmarad, ha az egsz agyat lecserlik egy ramkrre, amely csak annyit tesz, hogy a
bemenetekhez tartoz kimeneteteket visszakeresi egy risi tblzatban. Ez zavarba hozza a legtbb embert
(belertve magt Turingot is), akik intucija szerint a visszakeres tblk nem tudatosak, vagy legalbbis az
ltaluk generlt tudati tapasztalatok nem azonosak azokkal a tapasztalatokkal, amelyeket egy olyan rendszer
generlna, amit le lehetne rni gy (akr csak az egyszeren vett szmtsi rtelemben), mint ami hiedelmeket,
nismeretet, clokat s hasonlkat tart nyilvn s hoz ltre. Mindez sugallja, hogy ha meg akarjuk rizni az
agyprotzis-ksrletet mint az intucinkat vezrl segdeszkzt, akkor nem folyamodhatunk az agy egy
lpsben trtn lecserlshez, de azt nem jelenti, hogy knytelenek lennnk a lpsenknti neuroncserhez
folyamodni, amit Searle szeretne velnk elrni.
842
Created by XMLmind XSL-FO Converter.
Filozfiai alapok
Legutols gondolatksrletnk valsznleg egyben a leghresebb is. John Searle (Searle, 1980) gondolta ki, s
egy olyan hipotetikus rendszert r le, amely ltnivalan egy programot futtat, s megfelel a Turing-teszten; de
ugyanilyen vilgos az is (legalbbis Searle szerint), hogy semmit sem rt meg a bemenetei s kimenetei kzl.
Konklzija szerint teht a megfelel program futtatsa (azaz a megfelel vlaszok meglte) nmagban mg
nem elgsges felttele az elmemivoltnak.
A rendszer egy csak angolul rt emberbl ll, akinek egy angol nyelven rt szablyknyve s tbbfajta
paprhalmaza van, melyek kzl nmely paprhalmaz res, nmelyen pedig valamilyen rthetetlen jelsorozat ll.
(Teht az ember a CPU szerept jtssza, a szablyknyv a programnak, a paprhalmazok pedig a
troleszkznek felelnek meg.) A rendszer egy szobban tallhat, amelynek csak egy kis nylsa van a
klvilgra. Ezen a nylson keresztl rthetetlen felirat paprcetlik jelennek meg. Az ember megtallja a
szablyknyvben ezeket a szimblumokat, s kveti az ott lertakat. Az utastsok kztt szerepelhet, hogy rjon
le szimblumokat j paprcdulkra, keressen szimblumokat a paprhalmazokban, rendezze t a halmazokat s
hasonlk. Vgl, az utastsok kvetkezmnyeknt, egy vagy tbb szimblumot egy paprdarabra msol, s
kiadja a klvilgba.
Fontos
Eddig minden knnyen kvethet. De kvlrl nzve azt ltjuk, hogy a rendszer knai mondatokat
fogad, knai mondatokat ad vissza, s ez a prbeszd nyilvnvalan ppannyira intelligens, mint amit
Turing elkpzelt.6 Searle ennek alapjn gy rvel: a szobban lv szemly nem rt knaiul (ez adott). A
szablyknyv s a paprcetlik, lvn ezek csak paprok, szintn nem rtenek knaiul. Ebbl az
kvetkezik, hogy a knai nyelv semmifle megrtse nem zajlik le. Teht Searle szerint a megfelel
program futtatsa nem vezet szksgszeren a megrtshez.
Turinghoz hasonlan Searle is megvizsglt nhny lehetsges ellenvetst az rvvel szemben, s meg is prblta
visszautastani ezeket. Tbb kommenttor, kztk John McCarthy s Robert Wilensky, azt hozta fel, amit Searle
rendszervlasznak nevez. Az ellenvets abban ll, hogy ugyan feltehet az a krds, miszerint a szobban lv
szemly rt-e knaiul, de ez olyan, mint ha azt krdeznnk, hogy a CPU tud-e kbgykt vonni. Mindkt esetben
nemmel kell felelnnk, de mindkt esetben lltjk a rendszervlasz hvei a rendszer egsze igenis
rendelkezik a krdses kpessggel. Az biztos, hogy ha megkrdezzk a knai szobt, rt-e knaiul, a vlasz
igenl lesz (mghozz folykony knaisggal). Turing udvarias felttelezse szerint ennyi elegend is.
Vlaszban Searle ismtelten rmutat arra, hogy sem az ember, sem a paprhalmaz nem tud knaiul, teht
semmilyen knaiul rts sem lehetsges. Tovbb hozzteszi, az is elkpzelhet, hogy az ember megtanulja a
szablyknyvet, s a cetlik tartalmt is a fejben tartja, teht csupn az ember az, aki knaiul tudhatna, ha
azonban megkrdezzk t (angolul), akkor a vlasza nemleges lesz.
Most mr a lnyegi krdsnl vagyunk. A paprok tartalmnak memorizlsa csak elterel hadmvelet, hiszen
mindkett ugyangy egy fut program fizikai megtesteslse. Searle igazi lltsa a kvetkez ngy aximn
alapszik (Searle, 1990):
1. A szmtgpprogramok formlis, szintaktikai entitsok.
2. Az elmnek mentlis tartalma, azaz szemantikja van.
3. A szintaktika nmagban mg nem elgsges a szemantikhoz.
4. Az elmt az agy okozza.
Az els hrom aximbl arra a kvetkeztetsre jut, hogy a programok nem elgsgesek az elmhez. Msknt
megfogalmazva: ugyan lehet elme egy programot futtat gens, de nem lesz szksgszeren elme csupn a
program futtatsa miatt. A negyedik aximbl pedig arra a kvetkeztetsre jut, hogy brmely ms
rendszernek, amely kpes elmt okozni, az aggyal (legalbb) megegyez kauzlis erkkel kell rendelkeznie.
Ebbl pedig arra jut, hogy brmely mestersges agynak nem elg csupn egy adott programot futtatni, hanem
dupliklnia kell az agy kauzlis erit, valamint hogy az emberi agy a mentlis jelensgeket nem csupn egy
program futtatsa rvn hozza ltre.
Az, hogy a paprhalmaz taln nagyobb, mint az egsz bolyg, s hogy a vlaszok ltrehozsa milli vekig eltarthat, az rv logikai
struktrjt nem rinti. A filozfiai kpzs egyik clja ppen az, hogy kialakuljon egy kifinomult rzk, amellyel klnvlaszthatk a
relevns s az irrelevns ellenvetsek.
6
843
Created by XMLmind XSL-FO Converter.
Filozfiai alapok
Az Egyeslt llamok eddigi legslyosabb atombalesetnek helyszne Pennsylvania llamban. Az 1979-ben trtnt baleset ugyan rendkvl
megrzta az amerikai kzvlemnyt, de kros egszsggyi kvetkezmnyeit tekintve nem mrhet a csernobili esethez. (A ford.)
7
844
Created by XMLmind XSL-FO Converter.
Filozfiai alapok
Az emberek az automatizci miatt elveszthetik a munkjukat. A modern ipari gazdasg ltalban vve fggv
vlt a szmtgpektl, st nhny klnleges MI-programtl is. A gazdasg nagy rsze pldul, klnsen az
Egyeslt llamokban, a fogyaszti hiteltl fgg. A hitelkrtya-krelmek elbrlst, a lehvsok engedlyezst
s a visszalsek feldertst napjainkban mestersges intelligencia programok vgzik. Azt is mondhatn valaki,
hogy ezek a programok tbb ezer dolgozt tettek munkanlkliv, de valjban, ha elvennnk ezeket a
mestersges intelligencia programokat, nem is lteznnek ilyen llsok, mert az emberi munka elviselhetetlen
tbbletkltsget rna ezekre a tranzakcikra. A mestersges intelligencit hasznl gpests mindeddig tbb
llst hozott ltre, mint ahnyat megszntetett, s ezek az j llsok rdekesebbek, s jobban fizetnek. Ma mr,
amikor a mestersges intelligencia programokat az embereket segt intelligens genseknek tekintik,
kevesebben flnek a munkahelyk elvesztstl, mint amikor a mestersges intelligencia clja az embereket
helyettest szakrti rendszerek ltrehozsa volt.
Az embereknek tl sok (vagy tl kevs) szabadidejk marad. Alvin Toffler a Future Shock-ban (Toffler, 1970)
ezt rta: A szzadfordul ta a munkaht 50%-kal cskkent. Nem lg ki a sorbl ha azt jsoljuk, hogy 2000-re
ismt felvel cskken. Arthur C. Clarke (Clarke, 1968b) azt rta, hogy 2001-ben az emberek taln mr a teljes
unalommal nznek szembe, ahol az let legnagyobb problmja a tbb szz tv-csatorna kzti vlaszts lesz. Az
egyetlen ezen jslatok kzl, amelyik kzel ll a megvalsulshoz, az a tv-csatornk szma (Springsteen, 1992).
Valjban a tudsintenzv ipargakban dolgoz emberek egy 24 rban mkd, integrlt szmtgpestett
rendszer rszv vlnak, s ahhoz, hogy lpst tartsanak, hosszabb munkarkra lettek knyszertve. Az ipari
gazdasgban a jutalom kzeltleg egyenesen arnyos a befektetett idvel; 10%-kal tbb munka tbb-kevsb
10%-os bevtelnvekedst jelent. Az informcis gazdasgban, amelyet a nagy svszlessg kommunikci s
a szellemi tulajdon knny replikcija jellemez (ezt nevezi Frank s Cook a-gyztes-mindent-visz
trsadalom-nak) (Frank s Cook, 1996), nagy jutalom jr azrt, ha valaki csak egy kicsit is jobb a versenyben:
10%-kal tbb munka akr 100%-os bevtelnvekedst is jelenthet. Ezrt egyre nvekv nyoms nehezedik
mindenkire, hogy kemnyebben dolgozzon. A mestersges intelligencia nveli a technolgiai innovci temt,
teht hozzjrul ehhez az ltalnos trendhez, de egyben a mestersges intelligencia tartalmazza annak grett is,
hogy az automatizlt gensek kicsit tvllaljk a teendket s egy kis idhz juttatnak minket.
Az emberek elveszthetik az egyedisgrzsket. Weizenbaum, az ELIZA program szerzje, Computer Power and
Human Reason (Weizenbaum, 1976) c. mvben rmutat nhny potencilis veszlyre, amelyeket a mestersges
intelligencia jelent a trsadalom szmra. Weizenbaum egyik f rve az, hogy a mestersges intelligencia
kutatsa lehetv teszi annak elkpzelst, hogy az emberek automatk volnnak, amely elgondols az
autonmia, vagy akr a humanits rzsnek megsznshez vezet. Vegyk szre azonban, hogy ez az
elkpzels jval rgebb ta van jelen, mint a mestersges intelligencia: legalbbis a LHomme Machine (La
Mettrie, 1748) c. knyvig vezethet vissza. Azt is vegyk szre, hogy az emberisg tllte mr az
egyedisgrzsnek ms cskkenseit is: A De Revolutionibus Orbium Coelestium (Kopernikusz, 1543)
kimozdtotta a Fldet a Naprendszer kzpontjbl, s a Descent of Man (Darwin, 1871) pedig a Homo sapienst
egy szintre helyezte a tbbi fajjal. A mestersges intelligencia, amenynyiben szles krben sikeres lesz, ppen
gy veszlyt jelenthet a 21. szzad morlis felttelezseire, ahogyan Darwin evolcis elmlete fenyegette a 19.
szzad morlis felttelezseit.
Az emberek elveszthetik a szemlyisgi jogaik egy rszt. Weizenbaum arra is rmutatott, hogy a
beszdfelismersi technolgia a lehallgats elterjedshez, s gy a polgri jogok vesztesghez vezethet. Nem
lthatta elre azt a vilgot, ahol a terrorista fenyegetettsg megvltoztatja, hogy az emberek mennyi
megfigyelst hajlandk elfogadni, azt azonban helyesen ismerte fel, hogy a mestersges intelligencia a tmeges
megfigyels eszkzv vlhat. Jslata taln mr valra is vlt: az Egyeslt llamok kormnynak titkos
Echelon-rendszere felvevllomsok, antennamezk s radarllomsok hlzatbl ll, a rendszert nyelvek
kzti fordtst, beszdfelismerst s kulcsszavas keresst hasznl szmtgpek tmogatjk, amelyek a telefon-,
az e-mail, a fax- s a telexforgalmat vizsgljk vgig.8 Nhnyan elfogadjk, hogy a szmtgpests a
magnszfra vesztesghez vezet. Scott McNealy, a Sun Microsystems vezetje azt mondta: Amgy is nulla a
magnszfrd. Felejtsd el. Msok nem rtenek ezzel egyet: Louis Brandeis br 9 ezt rta 1890-ben: A
magnszfrhoz val jog minden jogok legalapvetbbike () a jog az ember sajt szemlyisghez.
Az MI-rendszerek alkalmazsa megszntetheti a felelssgre vonhatsgot. Az Egyeslt llamokban ma
uralkod peresked kzhangulat fontos krdss tette a jogi felelssget. Amikor egy orvos a diagnzis
fellltsakor egy orvosi szakrti rendszer tletre hagyatkozik, ki tehet felelss a diagnzis hibjrt?
Szerencss mdon, s ez rszben a dntselmleti megkzelts orvoslsra gyakorolt egyre nvekv
befolysnak ksznhet, ma mr elfogadott alapelv, hogy az orvos, aki vgrehajtja a nagy vrhat hasznossgi
8
9
845
Created by XMLmind XSL-FO Converter.
Filozfiai alapok
846
Created by XMLmind XSL-FO Converter.
Filozfiai alapok
szingularitshoz. Eddig minden ms technolgia egy S alak grbt kvetett, ahol az exponencilis nvekeds
vgl lecsengett.
A bekvetkez szingularitsrl r Vinge-et rmti ez a lehetsg, de ms szmtgptudsok s futuristk
rmmel vrjk. Hans Moravec a Robot: Mere Machine to Transcendent Mind c. rsban azt jsolja, hogy a
robotok tven ven bell elrik az emberi intelligencit, majd pedig meghaladjk azt. Ezt rja:
Egsz gyorsan kiszortanak minket a ltezsbl. Msokkal szemben engem ez a lehetsg nem
tlt el aggodalommal, n ezeket a jvbeli gpeket a leszrmazottainknak, elmebeli
gyermekeink-nek tartom, akiket kpnkre s hasonlatossgunkra ptettnk, nmagunkknt
egy jval nagyobb kpessg alakban. A korbbi genercik biolgiai gyermekeihez
hasonlan az emberisg hossz tv jvrl alkotott legjobb remnyt testestik meg. Bels
ktelessgnk minden elnyt megadni nekik s ellpni tjukbl, ha mr tbbet nem tudunk
segteni.
(Moravec, 2000)
A The Age of Spiritual Machines (Kurzweil, 2000) c. mvben Ray Kurzweil azt jsolja, hogy 2000-re mr
ers trend lesz sszekapcsolni az emberi gondolkodst az eredetileg az emberi faj teremtette gpek vilgval.
Mg egy j sz is van: transzhumanizmus (transhumanism), amely az ezt a jvt vr aktv trsadalmi
mozgalmat jelli. Elegend csak annyit mondani, hogy az ilyen krdsek kihvst jelentenek a legtbb mai
erklcsi gondolkodnak, akik az emberi let s az emberi faj megrzst j dolognak tartjk.
Gondoljunk bele vgl a robotok nzpontjba. Ha a robotok tudatoss vlnak, akkor immorlis lehet puszta
gpknt kezelni ket (pldul darabokra szedni). A robotoknak maguknak is morlisan kell cselekednik:
beljk kell programozni a j s a rossz elmlett. A sci-fi rk, kezdve Isaac Asimovval (Asimov, 1942), mr el
is kezdtek foglalkozni a robotjogok s robotfelelssgek krdseivel. A jl ismert Mestersges intelligencia
(A.I.) (Spielberg, 2001) c. mozifilm Brian Aldiss trtnetn alapul, amelyben egy intelligens robot, akit arra
programoztak, hogy embernek kpzelje magt, kptelen feldolgozni, hogy nem kell tulajdonos-anyjnak. A
trtnet (s persze a film) a robotok polgrjogi mozgalmnak megalapozottsgrl gyzhet meg egyeseket.
4. sszefoglals
Ebben a fejezetben a kvetkez krdsekkel foglalkoztunk:
A filozfusok szhasznlata szerint a gyenge MI kifejezs azt a feltevst jelenti, hogy a gpek valsznleg
kpesek intelligensen viselkedni, az ers MI pedig azt a feltevst, hogy az ilyen gpek elmvel
rendelkezknek szmtannak (s nem elmt szimullknak).
Alan Turing visszautastotta a Tudnak-e gondolkodni a gpek? krdst, s egy viselkedsi tesztet lltott a
helybe. Sok, a gondolkod gpek lehetsgvel szemben felhozhat ellenvetst megellegezett. A
mestersges intelligencia kutati kzl kevesen szentelnek figyelmet a Turing-tesztre, elnyben rszestik, ha
a rendszerek gyakorlati problmamegold kpessgre sszpontostunk, nem pedig az emberek utnzsra
val kpessgkre.
A modern korban ltalnosan egyetrtenek abban, hogy a mentlis llapotok agyllapotok.
Sem az ers MI ellen, sem a mellette felhozhat rvek nem meggyzk. Kevs els vonalbeli MI-kutat
gondolja azt, hogy brmi fontos is fgg ennek a vitnak a kimeneteltl.
A tudatossg rejtly maradt.
A mestersges intelligencia s a kapcsold technolgik ltal a trsadalomra jelentett veszlyek hat fajtjt
azonostottuk. Arra a kvetkeztetsre jutottunk, hogy nhny veszly valszntlen, kett azonban tovbbi
megfontolst rdemel. Az els az, hogy az ultraintelligens gpek, a maitl nagyon klnbz, mde rnk
nzvst korntsem kedvez jvhz vezethetnek. A msodik pedig az, hogy a robottechnolgia a
pszichopatknak is a kezbe adhatja a tmegpusztt fegyverek kulcst. Arra jutottunk azonban, hogy ez a
fenyegets inkbb szrmazik a biotechnolgibl s a nanotechnolgibl, mintsem a robotikbl.
847
Created by XMLmind XSL-FO Converter.
Filozfiai alapok
Az elme termszete az kortl napjainkig a filozfiai elmletalkots lland tmja. Platn a Phaidn c.
dialgusban kifejezetten megvizsglta, majd elvetette azt a lehetsget, hogy az elme a test rszeinek
egybehangoltsga, szervezdsi mintja lenne (ez az llspont kzelt ahhoz, amit a modern elmefilozfiban
funkcionalizmusnak neveznk). Ehelyett arra az llspontra helyezkedett, hogy az elme egy halhatatlan, nem
anyagi llek, amely a testtl elvlaszthat, s szubsztancijban (lnyegi alkotelemt tekintve) klnbzik: ez a
dualizmus llspontja. Arisztotelsz az l lnyekre jellemz llek (grgl ) tbb fajtjt klntette el, s
legalbbis nhnyukra funkcionalista lerst adott (errl bvebben lsd (Nussbaum, 1978)).
Hrhedt Descartes dualisztikus elmefelfogsa, de ironikus mdon trtnelmi hatsa inkbb a mechanisztikus s
materialista elmefelfogs fel mutat. Az llatokat kifejezetten automatnak tartotta, s megellegezte a Turingtesztet: azt nem tudjuk elkpzelni, hogy [egy gp] a szavakat klnflekppen elrendezze, s ezltal rtelmesen
tudjon felelni arra, amit a jelenltben mondanak, amint ezt a legtompbb esz emberek is meg tudnak tenni
(Descartes, 1637).11 Azzal, hogy hevesen kardoskodott az llatok automata mivolta mellett, Descartes valjban
knnyebb tette, hogy az embereket is automatnak vljk, noha maga ezt a lpst sohasem tette meg. A
LHomme Machine (La Mettrie, 1748) c. knyv pontosan amellett rvelt, hogy az emberek automatk.
A modern analitikus filozfia ltalban elfogadja a materializmust (gyakran az agyllapot-azonossg elmlet
(identity theory) formjban (Place, 1956; Armstrong, 1968), ami szerint a mentlis llapotok azonosak az agyi
llapotokkal), de sokkal megosztottabb a funkcionalizmust, az emberi elme gpi analgijt tekintve, valamint
abban a krdsben, hogy sz szerinti rtelemben vve tudnak-e gondolkodni a gpek. Turing (Turing, 1950)
Computing Machinery and Intelligence c. cikkre adott korai filozfiai vlaszok egy rsze, pldul Scriven
(Scriven, 1953), megprblta cfolni, hogy rtelmes lenne azt mondani, hogy a gpek gondolkodhatnak, arra
alapozva, hogy ez srten a sz jelentst. Ezt a nzetet, legalbbis Scriven, cikknek jranyomshoz illesztett
fggelknek tansga szerint 1963-ra visszavonta (Anderson, 1964). A szmtstechnika-kutat Edsger
Dijkstra szerint Az a krds, hogy tud-e egy gp gondolkodni, nem rdekesebb annl, hogy tud-e szni egy
tengeralattjr. Ford s Hayes (Ford s Hayes, 1965) amellett rvelnek, hogy a Turing-teszt semmi segtsget
sem nyjt a mestersges intelligencia szmra.
Mivel az elmefilozfiban a mestersges intelligencia alapjn a funkcionalizmus vlasztsa tnik a
legtermszetesebbnek, a funkcionalizmus kritikja teht gyakran a mestersges intelligencia kritikjnak
formjt lti (mint Searle esetben). Block (Block, 1980) osztlyozst kvetve tbbfle funkcionalizmust
klnbztethetnk meg. Az agyllapot-azonossg elmlet egyik varinsa, a funkcionlis specifikci elmlete
(functional specification theory) (Lewis, 1966; 1980) a mentlis llapotokkal identifikland agyi llapotokat
a funkcionlis szerepk vlasztja ki. A gpi analgihoz szorosabban ktdik a funkcionlis llapotazonossg
elmlet (functional state identify theory) (Putnam, 1960; 1967). E szerint a mentlis llapotokat nem fizikai
agyi llapotokkal, hanem a kifejezett szmteszkzknt felfogott agy absztrakt szmtsi llapotaival kell
azonostani. Ezek az absztrakt llapotok felttelezs szerint fggetlenek az agy specifikus felptstl, ami
azonban nhnyakat arra ksztet, hogy a funkcionlis llapotazonossg elmletet a dualizmus egy formjnak
tartsk!
Mindkt agyllapot-azonossg elmletet, valamint a klnbz formj funkcionalizmusokat tmadjk azok a
szerzk, akik szerint ezek az elmletek nem megfelelk a mentlis llapotok qualia, azaz milyen rzs is ez
aspektusnak megmagyarzsra (Nagel, 1974). Searle ehelyett az intencionalits funkcionalizmusbeli
lltlagos megmagyarzhatatlansgra koncentrlt (Searle, 1980; 1984; 1992). Churchland s Churchland
(Churchland s Churchland, 1982) mindkt fajta kritikt visszautastjk.
Az eliminatv (kikszbl) materializmus (eliminative materialism) (Rorty, 1965; Churchland, 1979) abban
klnbzik az elmefilozfia tbbi jelents elmlettl, hogy meg sem ksrli a npies pszicholgia, az elmrl
alkotott htkznapi elkpzelseink igazolst, hanem mindet elveti, s megprblja az elme tisztn tudomnyos
elmletvel helyettesteni. Elmletileg akr a klasszikus mestersges intelligencia is szolgltathatn ezt a
tudomnyos elmletet, de valjban az eliminatv materialistk inkbb az idegtudomnytl s a neurlis hlk
kutatstl klcsnznek (Churchland, 1986), arra alapozva, hogy a klasszikus mestersges intelligencia,
klnsen a 10. fejezetben bemutatotthoz hasonl tudsreprezentcis kutatsi irny, hajlamos a npies
pszicholgia igazsgaira alapozni. Ugyan az intencionlis belltottsg llspont (Dennett, 1971) rtelmezhet
funkcionalistaknt, de valsznleg az eliminatv materializmus egyik formjnak kell tekinteni, mivel az
intencionlis belltottsg nem objektv tulajdonsga az gensnek, akire vonatkozik. Azt is vegyk figyelembe,
hogy lehetnk eliminatv materialistk egyes mentlis jelensgekkel kapcsolatban, mikzben msokat nem gy
elemznk. Dennett (Dennett, 1978) pldul a qualikat illeten sokkal inkbb eliminativista, mint az
intencionalitssal kapcsolatban.
11
A szveget a magyar fordts alapjn idztk: rtekezs a mdszerrl (ford. Szemere Samu s Boros Gbor). (A ford.)
848
Created by XMLmind XSL-FO Converter.
Filozfiai alapok
A fejezetben szltunk a gyenge MI-vel szembeni kritika lehetsges forrsairl. Ugyan a posztneurlis hlk
korszakban divatoss vlt idejtmltnak tartani a szimbolikus megkzeltseket, nem minden filozfus kritikus
a Jfajta, rgivgs MI-vel szemben. Akadnak ennek mg elktelezett, st akr gyakorl hvei is. Zenon
Pylyshyn (Pylyshyn, 1984) amellett rvelt, hogy a szmtsi modell nemcsak elviekben a legjobb modell a
megismers megrtshez, hanem a jelenlegi kutats tja is lehet, s kifejezetten megcfolta Dreyfus kritikjt
az emberi megismers szmtsi modelljrl. Gilbert Harman (Harman, 1983) a hiedelemmdosts vizsglatt
az igazsg-karbantart mestersges intelligencia rendszerek kutatshoz kapcsolta. Micheal Bratman az emberi
pszicholgirl alkotott hiedelem-vgy-intenci modelljt (Bratman, 1987) alkalmazta a tervksztssel
kapcsolatos mestersges intelligencia kutatsokra (Bratman, 1992). Aaron Sloman (Sloman, 1978, iii. o.), a
mestersges intelligencia ers hipotzisnek radiklis hve odig elment, hogy rasszistnak nevezte Joseph
Weizenbaumot (Weizenbaum, 1976), mert szerinte a felttelezett intelligens gpeket nem kellene szemlyeknek
tekinteni.
Az elmrl, az agyrl s a kapcsold tmkrl szl filozfiai irodalom kiterjedt, s a megfelel szaknyelv s
rvelsi mdozatokra vonatkoz megalapozott kpzs hinyban gyakran nehezen olvashat. Ehhez a
folyamathoz az Encyclopedia of Philosophy (Edwards, 1967) felettbb hasznos segtsget nyjthat meggyzen
informatv szcikkeivel. A The Cambridge Dictionary of Philosophy (Audi, 1999) rvidebb, de kzrthetbb
m, noha a f szcikkek (mint pldul az elmefilozfia) mg gy is akr tbb mint tz oldal hosszak is
lehetnek. A MIT Encyclopedia of Cognitive Science (Wilson s Keil, 1999) egyarnt foglalkozik az elme
filozfijval, biolgijval s pszicholgijval. Az elmefilozfirl (belertve ebbe a funkcionalizmust s
ms, a mestersges intelligencihoz ktd llspontokat) szl cikkek ltalnos gyjtemnye tallhat a
Materialism and the Mind-Body Problem-ben (Rosenthal, 1971) s a Readings in the Philosophy of Psychology
(Block, 1980) els ktetben. Biro s Shanan (Biro s Shanan, 1980) a funkcionalizmus ellen s mellett rvel
cikkekbl lltott ssze antolgit. Ms cikkgyjtemnyek kifejezetten a filozfia s a mestersges intelligencia
kapcsolatval foglalkoznak: Minds and Machines (Anderson, 1964); Philosophical Perspectives in Artificial
Intelligence (Ringle, 1979); Mind Design (Haugeland, 1981) s a The Philosophy of Artificial Intelligence
(Boden 1990). Szmtalan bevezet ltezik a filozfiai MI-krds-hez (Boden, 1977; 1990; Haugeland, 1985;
Copeland, 1993). A The Behavioral and Brain Sciences, rvidtve BBS, fontos folyirat, amelyet a mestersges
intelligencival s az idegtudomnyokkal kapcsolatos vitknak szentelnek. Tbb jsg foglalkozik a
mestersges intelligencia etikai s felelssgi krdseivel: AI and Society, Law, Computers and Artificial
Intelligence, valamint az Artificial Intelligence and Law.12
4.2. Feladatok
26.1.
Haladjon vgig Turing lltlagos gpi fogyatkossgokrl alkotott listjn, keresse meg, melyeket
valstottak mr meg, melyeket lehet elvben megvalstani egy programmal, s melyek problematikusak azrt,
mert tudatos mentlis llapotokat ignyelnek.
26.2.
Szksgszeren bizonytja-e a knai szoba rv cfolata, hogy a megfelelen programozott szmtgpek
mentlis llapotokkal rendelkeznek? Szksgszeren egytt jr-e az rv elfogadsa azzal, hogy a
szmtgpeknek nem lehetnek mentlis llapotaik?
26.3.
Az agyprotzis rv fontos rsze, hogy kpesnek kell lennnk a ksrleti szemly agyt visszalltani a normlis
llapotba, hogy kls viselkedse ugyanolyan legyen, mintha a mtt nem is trtnt volna meg. Megalapozott
lehet-e egy olyan szkeptikus ellenvets, miszerint ez azzal jrna, hogy mdostani kell a neuronoknak a
tudatossghoz ktd neurofiziolgiai tulajdonsgait, melyek klnbznek a funkcionlis viselkedsben
rsztvevktl.
26.4.
Keressen ki a populris mdibl egy vagy tbb, a mestersges intelligencia lehetetlensgre irnyul rvet, s
elemezze azt.
A magyar olvas a mestersges intelligencia filozfijrl Darabos Tams mvbl tjkozdhat: A gpestett rtelem. Vzlatok a
mestersges intelligencia filozfijrl. ron Kiad, Budapest, 1991. (A ford.)
12
849
Created by XMLmind XSL-FO Converter.
Filozfiai alapok
26.5.
Prbljon meg defincikat adni az intelligencia, a gondolkods s a tudatossg fogalmakra. Vessen fel
lehetsges ellenvetseket is a defincikkal szemben.
26.6.
Elemezze a mestersges intelligencinak a trsadalomra jelentett potencilis veszlyeit. Mely fenyegetsek a
legslyosabbak, s hogy lehetne kzdeni ellenk? Hogyan viszonyulnak ezek a potencilis elnykhz?
26.7.
A mestersges intelligencia jelentette potencilis fenyegetsek hogyan viszonyulnak ms szmtstechnikai,
vagy bio-, nano- s nukleris technolgikbl ered veszlyekhez?
26.8.
Nhny kritikus ellenvetse szerint a mestersges intelligencia lehetetlen, msok szerint meg tlsgosan is
lehetsges, s az ultraintelligens gpek veszlyt jelentenek. A kt felhozott ellenvets kzl melyiket tartja
valsznnek? Ellentmondsos-e a kettt egytt lltani?
850
Created by XMLmind XSL-FO Converter.
Fontos
Az gensrendszer s komponensei tekintetben mind tudomnyos megrtsnk, mind technolgiai
kpessgnk hatalmasat fejldtt. Ebben a fejezetben htrbb lpnk a rszletektl, s azt krdezzk:
Elvezet-e ez a fejlds egy vltozatos krnyezetekben mkdsre kpes, ltalnos cl intelligens
genshez? A 27.1. alfejezetben szmba vesszk az intelligens gens komponenseit, hogy
meghatrozhassuk, mi az, amit ismernk, s mi az, ami mg hinyzik. A 27.2. alfejezetben az ltalnos
gensarchitektra kapcsn tesszk ugyanezt. A 27.3. alfejezetben azt vizsgljuk, hogy a racionlis
gens tervezse-e az elsdlegesen helyes cl. (A vlasz: Nem igazn, de egyelre megteszi.) Vgl
a 27.4. alfejezetben azzal foglalkozunk, milyen kvetkezmnyekkel jrhat vllalkozsunk sikere.
1. genssszetevk
A 2. fejezetben szmos genstervet s azok komponenseit mutattuk be. Figyelmnket sszpontostand itt csak
a hasznossgalap genssel foglalkozunk, amelyet a 27.1. brn mutatunk be jra. Ez a legltalnosabb
genstervnk; de megvizsgljuk tanulsi kpessgekkel val kiterjesztst is (lsd 2.15. bra).
Interakci a krnyezettel szenzorok s beavatkozszervek segtsgvel. Ez a mestersges intelligencia
trtnetnek nagy rszben komoly hinyossg. Nhny tiszteletre mlt kivtellel minden MI-rendszert gy
ptettek fel, hogy embereknek kellett szolgltatniuk a bemeneteket, s rtelmezni a kimeneteket, a robotika
pedig alacsony szint feladatokra sszpontostott, ahol nagyrszt hinyzott a magas szint kvetkeztets s
tervkszts. Ez rszben a magas kltsgek s a komoly tervezi erfeszts miatt volt gy, ami ahhoz kellett,
hogy egyltaln valdi, mkd robotokat kapjunk. Az elmlt vekben az elre elksztett, programozhat
robotok mint pldul a 25.4. (b.) brn lthat ngylb robot megjelensvel a helyzet rohamosan
megvltozott. Ez a vltozs vgs soron a kicsi, olcs, nagy felbonts CCD-kamerknak s a kompakt,
megbzhat motoros hajtsoknak ksznheten kvetkezett be. Az MEMS- (mikro-elektromechikai rendszerek)
technolgia miniatrizlt gyorsulsmrket s giroszkpokat hozott ltre, napjainkban pedig olyan
beavatkozszerveket llt el, amelyek pldul egy mestersges repl rovart bizonyos kpessgekkel ruhznak
majd fel. (Taln MEMS-beavatkozszervek millii kapcsolhatk majd ssze, hogy nagy teljestmny
makroszkopikus beavatkozkat kapjunk.) A fizikai krnyezeteket illeten az MI-rendszereknek nem lehet tbb
kifogsa. Tovbb egy teljessggel j krnyezet, az internet is ltrejtt.
27.1. bra - Egy modell- s hasznossgalap gens, ahogyan elszr a 2.14. brn
bemutattuk
851
Created by XMLmind XSL-FO Converter.
MI: Jelen s jv
Nyomon kvetni a vilg llapott. Ez az intelligens gens szmra szksges legfontosabb kpessgek egyike,
amelyhez egyarnt szksg van rzkelsre s a bels reprezentci frisstsre. A 7. fejezetben tletlogikt
alkalmaztunk a vilg llapotnak nyomon kvetsre; a 10. fejezetben kiterjesztettk ezt az elsrend logikra;
a 15. fejezetben pedig szr algoritmusokat (filtering algorithms) mutattunk be, hogy a bizonytalan
krnyezeteket is kvetni tudjuk. Ezekre a szreszkzkre van szksg, amikor igazi teht tkletlen
rzkelsre kerl sor. A jelenlegi szr s rzkelsi algoritmusokat lehet gy kombinlni, hogy elg j
teljestmnyt kapjunk alacsony szint prediktumok lersnl, mint pldul a cssze az asztalon van, de van
mg megteend t elttnk, mg az algoritmusok azt is ki tudjk jelenteni, hogy: dr. Russell tezik dr.
Norviggel. Egy msik problma az, hogy ugyan az approximcis szr algoritmusok kpesek elg nagy
krnyezeteket kezelni, lnyegket tekintve azonban mg mindig propozicionlisak: a propozicionlis logikhoz
hasonlan nem kezelik explicit mdon az objektumokat s a relcikat. A 14. fejezetben bemutattuk, hogyan
lehet ennek a problmnak a megoldsra elsrend logikt alkalmazni; elvrsaink szerint nagy elrelpssel
fog majd jrni, ha a komplex krnyezetek kezelsre is alkalmazzk ezeket az elgondolsokat. Tovbb, mihelyt
egy bizonytalan krnyezetben elkezdnk objektumokrl beszlni, felmerl a bizonytalan azonossg (identity
uncertainty) problmja: nem tudjuk, melyik objektum melyik. A logika alap mestersges intelligenciban
meglehetsen elhanyagoltk ezt a problmt, mivel ltalban feltteleztk, hogy az szleletek lland
szimblumokat tartalmaznak az objektumok azonostsra.
Elrevetteni, rtkelni s kivlasztani jvbeli cselekvseket. Az alapvet tudsreprezentcis elvrsok itt is
ugyanazok, mint a vilg llapotnak nyomon kvetsnl; az elsdleges nehzsg a cselekvsekkel (mint
pldul beszlgetni s tezni) val boldogulsbl szrmazik, amelyek esetenknt az igazi gens elemi lpseinek
ezreit vagy milliit tartalmazhatjk. Az emberek is csak gy tudnak ezzel megbirkzni, hogy a viselkedst egy
hierarchikus struktrba (hierarchial structure) szervezik. A 12. fejezetben bemutatott tervezsi
algoritmusok nmelyike az ehhez hasonl mret problmk kezelsre hierarchikus s elsrend logikai
reprezentcit hasznl; msrszt pedig a 17. fejezetben megadott bizonytalansgi dntshoz algoritmusok
lnyegileg ugyanazon az elven alapulnak, mint a 3. fejezet llapottrbeli keres algoritmusai. Lthatan itt sok a
tennival, taln a hierarchikus megerstses tanuls (hierarchial reinforcement learning) jabb
fejlemnyei mentn.
Hasznossg mint a preferencik kifejezse. A racionlis dntseket az elvrt hasznossg maximalizlsra
alapozni elmletileg teljesen ltalnos, s megv a tisztn clorientlt megkzeltsek szmtalan hibjtl (mint
pldul az ellentmond clok s a bizonytalan elrsk). Mindeddig azonban kevs munka folyt a realisztikus
hasznossgi fggvnyek ellltsa tern kpzeljk el pldul az egymssal klcsnhatsban lv preferencik
komplex hlzatt, amelyeket az emberek irodai asszisztenseknt mkd gensnek meg kell rtenie. Elg
nehznek bizonyult az sszetett llapotokkal kapcsolatos preferencikat dekomponlni az sszetett llapotokrl
szl bizonyossgok Bayes-hls dekompozcijhoz hasonlan. Ennek az egyik oka az lehet, hogy az llapotok
852
Created by XMLmind XSL-FO Converter.
MI: Jelen s jv
2. gensarchitektrk
Termszetes, ha azt krdezzk: Melyik architektrt alkalmazzam a 2. fejezetben bemutatottak kzl? A
vlasz: Mindegyiket! Lttuk, hogy a reflexszer vlaszok alkalmasak az idkritikus helyzetekben, mg a
tudsalap elhatrozs lehetv teszi, hogy az gens elre tervezzen. Egy teljes gensnek egy hibrid
architektra (hybrid architecture) segtsgvel kpesnek kell lennie mindkettre. A hibrid architektra egyik
fontos tulajdonsga, hogy a klnbz dntsi komponensek hatra nem rgztett. A szerkeszts vagy
kompills (compilation) pldul az elhatrozs szintjn megjelen deklaratv informcit folyamatosan
hatkonyabb reprezentcikk alaktja t, eljutva vgl a reflexszer szintre (27.2. bra). (Ez a clja a 19.
fejezetben bemutatott magyarzatalap tanulsnak.) Az olyan rendszereknek, mint a SOAR (Laird s trsai, 1987)
s a THEO (Mitchell, 1990), pontosan ez a struktrjuk. Minden alkalommal, amikor explicit elhatrozs rvn
jutnak el egy problma megoldsig, a megolds ltalnostott verzijt is eltroljk a reflexszer komponens
rszre. Ennek a folyamatnak a fordtottjt kevsb tanulmnyoztk mg: a krnyezet vltozsakor a megtanult
reflexek lehet, hogy tbb mr nem rvnyesek, s az gensnek vissza kell trnie a tudatos konstrukci szintjre,
hogy j viselkedst hozhasson ltre.
Egy gensnek sajt kvetkeztetseit is az ellenrzse al kell tudnia vonni. A kvetkeztetst abba kell hagynia,
ha cselekvsre van szksg, s a kvetkeztetsre rendelkezsre ll idt a leggretesebb szmtsokra kell
fordtania. Egy taxisofr gensnek, pldul, ha kzvetlenl maga eltt balesetet szlel, nem flrk alatt, hanem
a msodperc tredke alatt el kell tudnia dnteni, hogy fkezni fog, vagy inkbb kikerli a balesetet. A
msodperc ezen tredkt a legfontosabb krdsek vizsglatra kell fordtania, hogy balra, illetve jobbra szabade a sv, s nincs-e kzvetlenl mgtte egy nagy teheraut, s nem arra, hogy milyen az id, mennyire kopnak a
gumik, vagy hogy hol tallja a kvetkez utast. Az ilyen problmkkal a vals idej MI (real-time AI)
foglalkozik. Ahogy az intelligens rendszerek egyre bonyolultabb trgyterletekre vonulnak be, minden
853
Created by XMLmind XSL-FO Converter.
MI: Jelen s jv
problma vals idejv vlik, hiszen az gensnek soha nem lesz elegend ideje arra, hogy a dntsi problmt
egzakt mdon oldja meg.
Vilgos, hogy srget szksg van az ltalnosabb dntshoz helyzetekben is mkd mdszerekre. Az utbbi
idben kt kecsegtet mdszertan is napvilgot ltott. Az els az akrmikor algoritmusok (anytime
algorithms) alkalmazsa (Dean s Boddy, 1988; Horvitz, 1987). Egy akrmikor algoritmusnl az algoritmus
kimenetnek minsge az id mlsval fokozatosan javul, brmikor szaktjuk is meg teht az algoritmust,
sszer dntshez jutunk. Az ilyen algoritmus vezrlst egy metadntsi eljrs vgzi, amely meghatrozza,
hogy rdemes-e a szmtsokat tovbb folytatni. Az akrmikor algoritmusra egy egyszer plda a ktszemlyes
jtkoknl ismertetett iteratv mlyt keress. Azonban bonyolultabb rendszerek amelyek szmos ilyen,
egyttesen mkd algoritmusbl llnak is konstrulhatk (Zilberstein s Russell, 1996). A msik mdszer a
dntselmleti metakvetkeztets (decision-theoretic metareasoning) (Horvitz, 1989; Russell s Wefald,
1991; Horvitz s Breese, 1996). Ebben a megkzeltsben az informcirtk elmlett (16. fejezet) a
szmtsok megvlasztsra hasznljuk. A szmts rtke mind a kltsgtl (a ksleltetett cselekvs miatt),
mind a hasznossgtl (a dnts javtott minsge miatt) fgg. A metakvetkeztetsi smkkal jobb keressi
algoritmusokat lehet ellltani, automatikusan garantlva az akrmikor tulajdonsgot. A metakvetkeztets
termszetesen kltsges, de a kompills arra is felhasznlhat, hogy a tlmunka kltsge eltrpljn a szmts
kltsge mellett, lvn hogy a szmts is felgyelt.
A metakvetkeztets csupn egyik aspektusa az ltalnos reflektv architektrnak (reflective architecture):
ezek az architektrk lehetv teszik a magn az architektrn bell keletkez szmtsi entitsok s
cselekvsek fltti tudatossgot. A reflektv architektrk elmleti alapja gy pthet fel, hogy a krnyezet
llapotbl s magnak az gensnek a szmtsi llapotbl ll, kzs llapotteret definilunk. Dntsi
eljrsokat s tanulsi algoritmusokat lehet gy tervezni, hogy ebben a kzs llapottrben mkdjenek, ezzel
segtve s javtva az gens szmtsi teljestmnyt.
Vgs soron azt vrjuk, hogy az olyan feladatspecifikus algoritmusok, mint amilyen az alfa-bta keress s a
htrafel lncols, eltnnek az MI-rendszerekbl, tovbb, hogy ezek olyan ltalnos mdszerekkel lesznek
helyettesthetk, amelyek az gens szmtsait j minsg dntsek hatkony ltrehozsa fel irnytjk.
MI: Jelen s jv
3. Korltozott racionalits (bounded rationality): Herbert Simon elvetette a tkletes (vagy akr a
kzeltleg tkletes) racionalits gondolatt, s a korltozott racionalitst lltotta a helyre (Simon, 1957),
ami a valdi gensek dntseinek ler elmlete. A kvetkezt rta:
A valsvilg-beli objektv racionlis viselkedshez, vagy akr csak ennek az objektv
racionlis viselkedsnek az elfogadhat megkzeltshez megoldand problmk mrethez
kpest tl kicsi az emberi elme komplex problmk megfogalmazsra s megoldsra
szolgl kapacitsa.
Herbert Simon
Azt javasolta, hogy a korltozott racionalits elsdlegesen az elfogadhatsgban (satisficing) nyilvnul meg:
olyan hossz ideig kell foglalkozni a dntssel, ami elegend egy elfogadhatan j vlasz megtallshoz.
Ezrt a munkjrt Simon kzgazdasgi Nobel-djat kapott, s ksbb rszletesen is rt mg rla (Simon, 1982).
Ez az emberi viselkedsnek sok esetben hasznosnak tn modellje, azonban nem ad formlis specifikcit az
intelligens gensek szmra, mert az elmlet nem adja meg az elfogadhatan j defincijt. Tovbb az
elfogadhatsg lthatan csak egyike a korltozott erforrsok lekzdst szolgl technikknak.
4. Korltozott optimalits, KO (bounded optimality, BO): Egy korltozottan optimlis gens adott szmtsi
erforrsok mellett a lehet legjobban cselekszik. Egy ilyen gens esetn az gensprogram vrhat
hasznossga legalbb olyan magas, mint az ugyanazon a gpen fut brmilyen ms gensprogram.
A ngy lehetsg kzl, gy tnik, a korltozott optimalits vlasztsa adja a legtbb eslyt az MI ers
elmleti megalapozsra. Megvan az az elnye, hogy elrhet: mindig van legalbb egy legjobb program a
tkletes racionalitsrl ugyanez nem mondhat el. A korltozottan optimalits gensek hasznosak a
mindennapi gyakorlatban is, a szmthat racionalits gensek ltalban nem, mg az elfogadhatsgra trekv
genseknl ez a szeszlyeiken mlik.
A hagyomnyos megkzelts az MI-ben az volt, hogy a szmthat racionalitssal kezdnk, majd az
erforrskorltok kielgthetsge rdekben kompromisszumokat hozunk. Ha ezek a korltok csak kis
problmkat okoznak, akkor a keletkez terv vrhatan a KO gens tervhez lesz hasonl. Ha azonban az
erforrskorltok kritikuss vlnak pldul mert a krnyezet egyre sszetettebb vlik , akkor a kt terv
vrhatan el fog trni egymstl. A korltozott optimalits elmlete ezen korltok kezelsre knl elveket.
A korltozott optimalitsrl egyelre keveset tudunk. Nagyon egyszer gpekhez s valamilyen mrtkben
korltozott krnyezetekhez korltozottan optimlis programok konstrulhatk (Etzioni, 1989; Russell s trsai,
1993). Bonyolult krnyezetekben mkd nagy, ltalnos rendeltets szmtgpek esetn azonban fogalmunk
sincs, hogy milyenek legyenek a KO-programok. Ha a korltozott optimalits konstruktv elmlete valaha is
megfogalmazhat lesz, hinnnk kell, hogy a korltozottan optimlis programok tervezse nem fog tlsgosan
fggni a hasznlt szmtgp rszleteitl. A tudomnyos kutatst nagyon megnehezten, ha pldul kiderlne,
hogy egy gigabjtos memrij gp nhny kbjt memrival val bvtse lnyegi klnbsget jelentene a
KO-program tervben. Ahhoz, hogy ez ne trtnjen meg, a korltozott optimalits kritriumait kiss lazbban
kell kezelni. Az aszimptotikus bonyolultsg (A) fggelk) mintjra definilhatjuk az aszimptotikus
korltozott optimalitst, AKO) (asymptotic bounded optimality, ABO) (Russell s Subramanian, 1995).
Tegyk fel, hogy egy P program egy M gp esetn korltozottan optimlis a krnyezetek E osztlyban, ahol a
krnyezetek komplexitsa nem korltozott. Ekkor a P' program egy AKO-program M rszre E-ben, ha egy P
programot egy kM gpen futtatva a teljestmnyben tlszrnyalja, s ahol a kM gp k-szor gyorsabb (vagy
nagyobb), mint M. Ha k nem bizonyulna risinak, elgedettek lehetnnk, ha nemtrivilis krnyezetek s
nemtrivilis architektrk esetn AKO-programokkal rendelkeznk. Kevs rci lenne abban, hogy risi
erfesztsek rn inkbb KO-, mint AKO-programokat keressnk, ha a hasznlhat gpek nagysga s
sebessge, gy tnik, egy adott id alatt konstans mrtkben gyis n.
Megkockztathatjuk azt is, hogy a KO- vagy az AKO-programok nagy teljestkpessg szmtgpek s
bonyolult krnyezetek esetn nem fognak szksgszeren egyszer s elegns struktrval rendelkezni. Lttuk
mr, hogy az ltalnos rendeltets intelligencihoz bizonyos fok reflexszer s tudatos kpessg szksges,
ami a tuds s a dntshozatali formk sokasgt, ezen formk mindegyikhez a tanul s a kompillsi
mechanizmusokat, a kvetkeztets vezrlsnek mdszereit s a trgyterletre vonatkoz specifikus tuds nagy
trt jelenti. A korltozottan optimlis gensnek adaptldnia kell ahhoz a krnyezethez, amelyben tartzkodik,
gy bels szervezettsge vgl az adott krnyezetre jellemz optimalizlsi smkat tkrzheti. Ez elvrhat,
hasonlkppen ahhoz, ahogy a slyukban s a lerben korltozott versenyautk szlssgesen kompliklt
konstrukcikig jutottak el. Az a sejtsnk, hogy a korltozott optimalitson alapul mestersges intelligencia
tudomnya nagy rszben olyan folyamatok tanulmnyozsbl fog llni, amelyek rvn egy gensprogram a
855
Created by XMLmind XSL-FO Converter.
MI: Jelen s jv
korltozott optimalitshoz fog konverglni, s taln kevsb fog az eredmnyl kapott, nehezen ttekinthet
programok rszleteivel trdni.
sszegezve, a korltozott optimalits koncepcijt jl definilt s kivitelezhet kutatsi feladatnak javasoljuk a
mestersges intelligencia kutatsa szmra. A korltozott optimalits az optimlis programokat specifiklja, s
nem az optimlis cselekvst. A cselekvst gyis a programok generljk, s a programok azok, amelyek felett a
tervez befolyssal rendelkezik.
856
Created by XMLmind XSL-FO Converter.
Az elemzs els lpse a bemenetektl val eltekints, olyan paramter vagy paramterek megkeresse, amely
vagy amelyek jellemzk a bemenet mretre. Jelen pldban a bemenetet a szekvencia hosszval
jellemezhetjk, aminek a jele legyen n. Msodik lps az implementciktl val eltekints, azaz egy olyan
mrtk megkeresse, amely tkrzi az algoritmus futsiid-ignyt, de nem ktdik egy konkrt fordthoz
vagy szmtgphez. Az SSZEGZS program esetn ez lehetne pldul a vgrehajtott kd sorainak a szma. A
mrtk rszletesebb is lehetne, kln specifiklva az algoritmus ltal vgrehajtott sszeadsok, rtkadsok,
tmbhivatkozsok s elgazsok szmt. Mindkt esetben megkapjuk az algoritmus ltal vgzett lpsek teljes
szmnak a jellemzst a bemenet nagysgnak fggvnyben, amit T(n)-nek fogunk nevezni. Ha
megszmoljuk a kd sorait, a pldnk esetben az eredmny T(n) = 2n + 2.
Ha minden program olyan egyszer lenne, mint az SSZEGZS, az algoritmusok elemzse trivilis lenne. Kt
problma miatt a helyzet azrt bonyolultabb. Elszr is, ritka eset olyan paramtert tallni, mint az n, amely
teljes egszben jellemzi az algoritmus ltal vgrehajtott lpsek szmt. A legjobb, amivel ehelyett
rendelkezhetnk, a legrosszabb esetet jelent Tlegrosszabb(n) vagy az tlagos Ttlag(n) szmtsa. Az tlag
kiszmtshoz az elemznek fel kell tteleznie a bemenetek valamilyen eloszlst.
A msik problma az, hogy az algoritmusok ellenllnak az egzakt elemzsnek. Ilyen esetben kzeltsekre
szksges tmaszkodnunk. Azt mondhatjuk, hogy az SSZEGZS algoritmus O(n) avagy nagy ord n
jelezvn, hogy a mrtke, nhny kis rtk n kivtelvel, a legtbb esetben n konstans-szorosa. Formlisan:
T(n) O(f (n)) mrtk, ha T(n) kf(n) valamilyen k-ra, minden n > n0 esetn.
Az O(n) jells az aszimptotikus analzist (asymptotic analysis) jelenti. Kln vizsglat nlkl azt
mondhatjuk, hogy ha n aszimptotikusan kzeledik a vgtelenhez, egy O(n) algoritmus jobb, mint egy O(n2)
algoritmus. Egy egyedi teljestmnymr adat egy ilyen kijelentst nem tudna altmasztani.
Az O() jells a konstans szorzktl eltekint, emiatt kevsb precz, viszont knnyebb hasznlni, mint a T()-t.
gy pldul egy O(n2) algoritmus egy O(n) algoritmusnl hossz tvon mindig rosszabb lesz, azonban ha a kt
algoritmus T(n2 + 1) s T(100n + 1000), akkor az O(n2) algoritmus n 110-re jobb lesz.
857
Created by XMLmind XSL-FO Converter.
Matematikai alapok
858
Created by XMLmind XSL-FO Converter.
Matematikai alapok
A matematikusok egy vektort egy vektortrelemknt definilnak. Mi azonban konkrtabb defincit fogunk
hasznlni. Egy vektor az rtkek egy rendezett szekvencija. A ktdimenzis trben pldul olyan vektoraink
vannak, mint: x = 3, 4 s y = 0, 2 . A szoksos konvencihoz folyamodunk vastagon szedett betket
hasznlva a vektorneveknek, br egyes szerzk a nevek fl nyilat vagy vonalat hznak:
elemeire indexekkel lehet hivatkozni: z = z1, z2, , zn .
. Egy vektor
A vektorokon rtelmezett kt alapvet mvelet a vektorok sszeadsa s egy skalrral val szorzsa. Az x + y
vektorsszeads az elemenknti sszegzs: x + y = 3 + 0, 4 + 2 = 3, 6 . A skalrszorzs mindegyik
elemet egy konstans rtkkel szorozza be: 5x = 5 3, 5 4 = 15, 20 .
Egy vektor hosszt az |x| jelli, amelynek rtke egyenl a vektor elemeinek ngyzetsszegbl vett
ngyzetgykvel:
sszege, azaz
A vektorokat sokszor egy n-dimenzis euklideszi tr irnytott vonalszakaszainak (nyilaknak) kpzeljk. Ekkor
a vektorsszeads annak felel meg, mintha az egyik vektor kezd pontjt a msik vektor vgpontjhoz
illesztennk, az x y skalrszorzat viszont |x||y|cos-vel lesz egyenl, ahol az x s az y kztti szg.
Egy mtrix az rtkek ngyszgletes elrendezse sorokba s oszlopokba. Itt egy 3 4 mret m mtrixot
ltunk:
Az mi,j els indexe a sort, a msodik az oszlopot jelli. Programozsi nyelvekben mi,j-t gyakran m[i,j], vagy
m[i][j]-nek rjk.
Kt mtrix sszegt a megfelel elemek sszeadsval definiljuk: (m + n)i,j = mi,j + ni,j. (Az sszeg klnbz
mret m s n mtrixokra nincs definilva.) Egy mtrixnak egy skalrral trtn szorzatt szintn
definilhatjuk: (cm)i,j = cmi,j. A mtrixszorzat (kt mtrix szorzata) mr bonyolultabb. Az mn szorzat csak
akkor definilt, ha az m mtrix a b, az n mtrix pedig b c mret (azaz a msodik mtrixnak annyi sora van,
mint amennyi oszlopa az els mtrixnak). Az eredmny egy a c mret mtrix. Ez azt jelenti, hogy a
mtrixszorzat nem kommutatv: ltalnossgban mn nm. Ha a mtrixok megfelel mretek, akkor az
eredmny:
859
Created by XMLmind XSL-FO Converter.
Matematikai alapok
Itt az x y z c nem rsze a mtrixnak, csak emlkeztetl szolgl. Tudjuk, hogy ha egy egyenlet mindkt oldalt
egy konstanssal megszorozzuk, vagy ha kt egyenletet egymshoz hozzadunk, akkor szintn egy rvnyes
egyenlethez jutunk el. A Gauss Jordan-eliminci ezeket a lpseket ismtelten alkalmazza gy, hogy elszr
az els vltozt (az x-et) eliminljuk, az elst kivve az sszes egyenletbl, majd folytatjuk minden i-re, az iedik vltozt minden egyenletbl eliminlva, az i-edik egyenletet kivve. Az x-et a msodik egyenletbl gy
eliminljuk, hogy az els egyenletet 3/2-vel megszorozzuk, az eredmnyt pedig a msodik egyenlethez
hozzadjuk. Ezzel az albbi mtrixhoz jutunk el:
-knt rvidtjk.
A P(B|A) feltteles valsznsget a P(B A)/P(A) definilja. A s B felttelesen fggetlenek, ha P(B|A) = P(B)
[vagy ekvivalens mdon P(A|B) = P(A)]. Folytonos vltozk esetn az rtkek halmaza vgtelen, s hacsak
pontszer tskk nincsenek, mindegyik rtk valsznsge 0. Emiatt egy valsznsgi srsgfggvnyt
(probability density function) definilunk, amit szintn P(X)-szel fogunk jellni. P(X) jelentse a P(A) diszkrt
valsznsgi fggvnytl kiss eltr. A P(X = c) srsgfggvny-rtk az a valsznsg, hogy az X a c krli
intervallumba esik, elosztva az intervallum hosszval, s hatrtmenetet kpezve, ahogy az intervallum hossza
tart a 0-hoz:
860
Created by XMLmind XSL-FO Converter.
Matematikai alapok
Definilhatunk egy valsznsgi eloszlsfggvnyt (cumulative probability density function), F(X)-et is,
ami annak a valsznsge, hogy a vletlen vltoz x-nl kisebb:
Jegyezzk meg, hogy a valsznsgi srsgfggvnynek ltezik egysge, az eloszlsfggvny viszont egysg
nlkli. Ha az X-et pldul msodpercben mrjk, akkor a srsget Hz-ben (azaz 1/s) fogjuk. Ha X a mterben
mrt hromdimenzis tr egy pontja, akkor a srsget 1/m3-ben mrjk.
Az egyik legfontosabb valsznsg-eloszls a Gauss-eloszls (Gaussian distribution), amit normlis
eloszlsnak (normal distribution) is szoks nevezni. A kzprtk s szrs (2 variancij) Gausseloszls defincija:
ahol x egy folytonos vltoz -tl +-ig terjed rtkkszlettel. = 0 s 2 = 1 mellett kapjuk a standard
normlis eloszls (standard normal distribution) specilis esetet. Egy d dimenzis x vektor feletti eloszls a
tbbvltozs Gauss-eloszls (multivariate Gaussian distribution):
Matematikai alapok
szmtgpes szakemberek mirt a polinom s az exponencilis futsi idigny hatrra teszik egyhangan a
kezelhet s kezelhetetlen problmk kztti hatrvonalat. A szerzk az NP-teljesknt vagy ms szempontbl
kezelhetetlennek ismert problmk terjedelmes katalgust is mellkelik.
A valsznsg-szmtsrl j mvek (Chung, 1979; Ross, 1988; BertsekasTsitsiklis, 2002; Feller, 1971).
862
Created by XMLmind XSL-FO Converter.
B. fggelk - Megjegyzsek a
nyelvekrl s az algoritmusokrl
1. B1. Nyelvek definilsa BackusNaur-Formban
(BNF)
Jelen knyvben definiltunk nhny nyelvet, az tletlogika nyelvt (3. szakasz - A logika rsz), az elsrend
logika nyelvt (2.2. szakasz - Szimblumok s interpretcik rsz) s az angol nyelv rszhalmazt (4. szakasz Kiterjesztett nyelvtanok rsz). Egy formlis nyelvet mondathalmazknt definilunk, ahol egy-egy mondat a
szimblumok halmaza. A szmunkra rdekes nyelvek mindegyike vgtelen sok mondatbl ll,
kvetkezskppen szksgnk van e halmaz tmr jellemzsre. A jellemzst egy nyelvtan (grammar)
segtsgvel ksreljk meg. Nyelvtanunkat BackusNaur-forma (Backus Naur form) vagy BNFformalizmusban fejezzk ki. Egy BNF-nyelvtannak ngy komponense van:
A zrszimblumok vagy a terminlisok (terminal symbols) halmaza. Ezekbl a szimblumokbl,
mskppen szavakbl, llnak ssze a nyelv mondatai. Ezek lehetnek betk (A, B, C, ) vagy szavak (a,
aardvark, abacus, ...).
A nyelv rszkifejezseit kategorizl nemzr szimblumok vagy nemterminlisok (nonterminal
symbols) halmaza. Az angol nyelvben pldul a FnviKifejezs (NounPhrase) nemzr szimblum a you
s a the big slobbery dog mondatokat is tartalmaz vgtelen halmazt jelenti.
A kezd szimblum (start symbol) a nyelv teljes mondatait jelent nemzr szimblum. Az angol nyelv
esetn ez a Mondat (Sentence), az aritmetika esetn ilyen szimblum lehet a Kifejezs (Expr).
A kpzsi szablyok (rewrite rules) halmaza, ahol egy-egy szably LHS RHS formj. LHS egy nemzr
szimblum, az RHS pedig 0 vagy tbb (zr vagy nemzr) szimblumbl llhat.
A
Mondat FnviKifejezs IgeiKifejezs
alak kpzsi szably azt jelenti, hogy ha brmikor is van kt, egy FnviKifejezs-knt s egy IgeiKifejezsknt kategorizlt mondatunk, akkor azokat sszekapcsolhatjuk, s az eredmnyt Mondat-knt kategorizlhatjuk.
A | szimblum az alternatv jobb oldali kifejezseket vlasztja szt. Nzzk most az egyszer aritmetikai
kifejezsek BNF- nyelvtant:
Kifejezs
Opertor
Kifejezs
Kifejezs ) | Szm
Kifejezs
Szm
Szmjegy
0|1|2|3|4|5|6|7|8|9
Opertor
+ | | |
863
Created by XMLmind XSL-FO Converter.
Megjegyzsek a nyelvekrl s az
algoritmusokrl
A knyvnkben tbb mint 80 algoritmust definiltunk rszletesen. Ahelyett hogy egy programozsi nyelvet
vlasztottuk volna (s ahelyett, hogy azt kockztattuk volna, hogy a nyelvet nem ismer olvas elveszti a
fonalat), gy dntttnk, hogy pszeudokddal rjuk le az algoritmusokat. Ezek legtbbje rthet lesz azoknak,
akik Javt, C++-t, Lispet vagy hasonl nyelveket hasznlnak. Helyenknt azonban matematikai formulkat,
illetve mindennapi nyelvet hasznlunk olyan rszek lershoz, amelyek msklnben nehezebben lennnek
olvashatk. Nhny egyni vonsrl is szt kell ejtennk.
Statikus vltozk. A static kulcsszt egy olyan vltoz megjellsre hasznljuk, amely kezdeti vagy a
rkvetkez rtkadsbl add rtkt a fggvny els hvsnl kapja meg, s megtartja a fggvny minden
azt kvet hvsnl. A statikus vltoz teht hasonlt egy globlis vltozra abban, hogy a fggvny egyedi
hvst tlli, rtke azonban csak a fggvnyen bell frhet hozz. A knyv gensprogramjai statikus
vltozkat memria ltestsre hasznlnak. A statikus vltozkat kezel programok objektumknt
implementlhatk olyan objektumorientlt nyelvekben, mint a Java vagy a Smalltalk. A funkcionlis
nyelvekben az implementlsuk knnyen oldhat meg a lambda-kifejezs vgrehajtsval egy olyan
krnyezeten bell, amelyben a szksges vltozt definiltuk.
Fggvnyek mint rtkek. A fggvnyek s eljrsok jellsre nagybets neveket, a vltozk jellsre pedig
kis-, dlt bets neveket hasznlunk. Egy fggvnyhvs legtbb esetben teht FN(x) kpet nyjt. Megengedjk
azonban, hogy egy vltoz fggvnyrtket is felvehessen. Ha az f rtke pldul a ngyzetgykfggvny, akkor
az f (9) ltal visszaadott rtk a 3.
A tmbk 1-tl kezddnek. Ha mskppen nincs specifiklva, egy tmb els indexe mindig 1, ahogy ez a
matematikban szoks, s nem 0, mint a Javban vagy a C-ben.
A beljebb szedett bekezds fontos. A beljebb szedett bekezdst a hurok vagy a feltteles kifejezs
hatskrnek megjellsre hasznljuk, mint pldul a Python nyelvben, ellenttben a Javval s a C++-szal
(ahol a zrjelezs hasznlatos), illetve a Pascallal s a Visual Basickel (ahol egy end hasznlatos).
Fontos
Ha nnek megjegyzsei lennnek a knyvnkkel kapcsolatban, hibkat vett szre, illetve ha tletei
vannak, amelyekkel a knyv javthat, keressen meg bennnket. Krjk, ltogassa meg a
weboldalunkon a vitafrumunkat, vagy kldjn e-mail zenetet a kvetkez cmre:
aima@cs.berkeley.edu
864
Created by XMLmind XSL-FO Converter.
C. fggelk - Irodalomjegyzk
Aarup, M., Arentoft, M. M., Parrod, Y., Stadler, J., and Stokes, I. (1994). OPTIMUM-AIV: A knowledgebased planning and scheduling system for spacecraft AIV. In Fox, M. and Zweben, M. (Eds.), Knowledge Based
Scheduling. Morgan Kaufmann, San Mateo, California.
Abramson, B. and Yung, M. (1989). Divide and conquer under global constraints: A solution to the N-queens
problem. Journal of Parallel and Distributed Computing, 6(3), 649662.
Ackley, D. H. and Littman, M. L. (1991). Interactions between learning and evolution. In Langton, C., Taylor,
C. Farmer, J. D., and Ramussen, S. (Eds.) Artificial Life II, pp. 487509. Addison-Wesley, Redwood City,
California.
Adelson-Velsky, G. M., Arlazarov, V. L., Bitman, A. R., Zhivotovsky, A. A., and Uskov, A. V. (1970).
Programming a computer to play chess. Russian Mathematical Surveys, 25, 221262.
Adelson-Velsky, G. M., Arlazarov, V. L., and Donskoy, M. V. (1975). Some methods of controlling the tree
search in chess programs. Artificial Intelligence, 6(4), 361371.
Agmon, S. (1954.) The relaxation method for linear inequalities. Canadian J. Math., 6(3), 382392.
Agre, P. E. and Chapman, D. (1987). Pengi: an implementation of a theory of activity. In Proceedings of the
Tenth International Joint Conference on Artificial Intelligence (IJCAI-87), pp. 26872, Milan. Morgan
Kaufman.
Aho, A. V., Hopcroft, J., and Ullman, J. D. (1974). The Design and Analysis of Computer Algorithms. AddisonWesley, Reading, Massachusetts.
Aho, A. V. and Ullman, J. D. (1972). The Theory of Parsing, Translation and Compiling. Prentice-Hall, Upper
Saddle River, New Jersey.
Ait-Kaci, H. and Podelski, A. (1993). Towards a meaning of LIFE. Journal of Logic Programming, 16(34),
195234.
Aizerman, M., Braverman, E., and Rozonoer, L. (1964). Theoretical foundations of the potential functions
method in pattern recognition learning. Automation and Remote Control, 25, 821837.
Albus, J. S. (1975). A new approach to manipulator control: The cerebellar model articulation controller
(CMAC). Journal of Dynamic Systems, Measurement, and Control, 97, 270277.
Aldous, D. and Vazirani, U. (1994). Go with the winners algorithms. In Procceedings of the 35th Annual
Symposiumon Foundations of Computer Science, pp. 492501, Santa Fe, New Mexico. IEEE Computer Society
Press.
Allais, M. (1953). Le comportment de lhomme rationnel devant la risque: critique des postulats et axiomes de
lcole Amricaine. Econometrica, 21, 503546.
Allen, J. F. (1983). Maintaining knowledge about temporal intervals. Communications of the Association for
Computing Machinery, 26(11), 832843.
Allen, J. F. (1984). Towards a general theory of action and time. Artificial Intelligence, 23, 123154.
Allen, J. F. (1991). Time and time again: The many ways to represent time. International Journal of Intelligent
Systems, 6, 341355.
Allen, J. F. (1995). Natural Language Understanding. Benjamin/Cummings, Redwood City; California.
Allen, J. F., Hendler, J., and Tate, A. (Eds.). (1990). Readings in Planning. Morgan Kaufmann, San Mateo,
California.
865
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Almuallim, H. and Dietterich, T. (1991). Learning with many irrelevant features. In Proccedings of the Ninth
National Conference on Artificial Intelligence (AAAI-91), Vol. 2, pp. 547552, Anaheim, California. AAAI
Press.
ALPAC (1966). Language and machines: Computers in translation and linguistics. Tech. rep. 1416, The
Automatic Language Processing Advisory Committee of the National Academy of Sciences, Washington, DC.
Alshawi, H. (Ed.). (1992). The Core Language Engine. MIT Press, Cambridge, Massachusetts.
Alterman, R. (1988). Adaptive planning. Cognitive Science, 12, 393422.
Amarel, F. (1998). On representations of problems of reasoning about actions. In Michie, D. (Ed.), Machine
Intelligence 3, Vol. 3, pp. 131171. Elsevier/North-Holland, Amsterdam, London, New York.
Ambros-Ingerson, J. and Steel, S. (1988). Integrating planning, execution and monitoring. In Proceedings of
the Seventh National Conference on Artificial Intelligence (AAAI-88), pp. 735740, St. Paul, Minnesota.
Morgan Kaufmann.
Amit, D., Gutfreund, H., and Sompolinsky, H. (1985). Spin-glass models of neural networks. Physical Review,
A 32, 10071018.
Andersen, S. K., Olesen, K. G., Jensen, F. V., and Jensen F. (1989). HUGIN a shell for building Bayesian
belief universes for expert systems. In Proceedings of the Eleventh International Joint Conference on Artificial
Intelligence (IJCAI-89), Vol. 2, pp. 10801085. Detroit. Morgan Kaufmann.
Anderson, A. R. (Ed.) 1964). Minds and Machines. Prentice-Hall, Upper Saddle River, New Jersey.
Anderson, J. A. and Rosenfeld, E. (Eds.). (1988). Neurocomputing: Foundations of Research. MIT Press,
Cambridge, Massachusetts.
Anderson, J. R. (1980). Cognitive Psychology and Its Implications. W. H. Freeman, New York.
Anderson, J. R. (1993). The Architecture of Cognition. Harvard University Press, Cambridge, Massachusetts.
Andre, D. and Russell, S. J. (2002). State abstraction for programmable reinforcement learning agents. In
Proceedings of the Eighteenth National Conference on Artificial Intelligence (AAAI-02), pp. 119125,
Edmonton, Alberta. AAAI Press.
Anshelevich, V. A. (2000). The game of Hex: An automatic theorem proving approach to game programming.
In Proceedings of the Seventeenth National Conference on Artificial Intelligence (AAAI-00), pp. 189194.
Austin, Texas. AAAI Press.
Anthony, M. and Bartlett, P. (1999). Neural Network Learning: Theoretical Foundations. Cambridge
University Press, Cambridge, UK.
Appel, K. and Haken, W. (1977). Every planar map is four colorable: Part I: Discharging. Illinois J. Math., 21,
429490.
Apt, K. R. (1999). The essence of constraint propagation. Theoretical Computer Science, 221 (12), 179210.
Apt, C. Damerau, F., and Weiss, S. (1994). Automated learning of decision rules for text categorization. ACM
Transactions on Information Systems, 12, 233251.
Arkin, R. (1998). Behavior-Based Robotics. MIT Press, Boston, MA.
Armstrong, D. M. (1968). A Materialist Theory of the Mind. Routledge and Kegan Paul, London.
Arnauld, A. (1662). La logique, ou lart de penser. Chez Charles Savreux, au pied de la Tour de Nostre Dame,
Paris.
Arora, S. (1998). Polynomial time approximation schemes for Euclidean traveling salesman and other
geometric problems. Journal of the Association for Computing Machinery, 45(5), 753782.
866
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Ashby, W. R. (1940). Adaptiveness and equilibrium. Journal of Mental Science, 86, 478483.
Ashby, W. R. (1948). Design for a brain. Electronic Engineering, December, 379383.
Ashby, W. R. (1952). Design for a Brain. Wiley, New York.
Asimov, I. (1942). Runaround. Astounding Science Fiction, March.
Asimov, I. (1950). I. Robot. Doubleday, Garden City, New York.
Astrom, K. J. (1965). Optimal control of Markov decision processes with incomplete state estimation. J. Math.
Anal. Applic., 10, 174205.
Audi, R. (Ed.). (1999). The Cambridge Dictionary of Philosophy. Cambridge University Press, Cambridge, UK.
Austin, J. L. (1962). How To Do Things with Words. Harvard University Press, Cambridge, Massachusetts.
Axelrod, R. (1985). The Evolution of Cooperation. Basic Books, New York.
Bacchus, F. (1990). Representing and Reasoning with Probabilistic Knowledge. MIT Press, Cambridge,
Massachusetts.
Bacchus, F. and Grove, A. (1995). Graphical models for preference and utility. In Uncertainty in Artificial
Intelligence: Proceedings of the Eleventh Conference, pp. 310, Montreal, Canada, Morgan Kaufmann.
Bacchus, F. and Grove, A. (1996). Utility independence in a qualitative decision theory. In Proceedings of the
Fifth International Conference on the Principles of Knowledge Representation and Reasoning, pp. 542552,
San Mateo, California, Morgan Kaufmann.
Bacchus, F. Grove, A., Halpern, J. Y., and Koller, D. (1992). From statistics to beliefs. In Proceedings of the
Tenth National Conference on Artificial Intelligence (AAAI-92), pp. 602608, San Jose. AAAI Press.
Bacchus, F. and van Beek, P. (1998). On the conversion between non-binary and binary constraint satisfaction
problems. In Proceedings of the Fifteenth National Conference on Artificial Intelligence (AAAI-98), pp. 311
318, Madison, Wisconsin. AAAI Press.
Bacchus, F. and van Run, P. (1995). Dynamic variable ordering in CSPs. In Proceedings of the First
International Conference on Principles and Practice of Constraint Programming, pp. 258275, Cassis, France.
Springer-Verlag.
Bachmann, P. G. H. (1894). Die analytische Zahlentheorie. B. G. Teubner, Leipzig.
Backus, J. W. (1996). Transcript of question and answer session. In Wexelblat, R. L. (Ed.), History of
Programming Languages, p. 162. Academic Press, New York.
Baeza-Yates, R. and Ribeiro-Neto, B. (1999). Modern Information Retrieval. Addison Wesley Longman,
Reading, Massachusetts.
Bajcsy, R. and Lieberman, L. (1976). Texture gradient as a depth cue. Computer Graphics and Image
Processing, 5(1), 5267.
Baker, C. L. (1989). English Syntax. MIT Press, Cambridge, Massachusetts.
Baker, J. (1975). The Dragon system overview. IEEE Transactions on Acoustics, Speech, and Signal
processing, 23, 2429.
Baker, J. (1979). Trainable grammars for speech recognition. In Speech Communication Papers for the 97th
Meeting of the Acoustical Society of America, pp. 547550, Cambridge, Massachusetts. MIT Press.
Baldwin, J. M. (1896). A new factor in evolution. American Naturalist, 30, 441451. Continued on pages 536
553.
867
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Ballard, B. W. (1983). The *-minimax search procedure for trees containing chance nodes. Artificial
Intelligence, 21(3), 327350.
Baluja, S. (1997). Genetic algorithms and explicit search statistics. In Mozer, M. C. Jordan, M. I., and Petsche,
T. (Eds.), Advances in Neural Information Processing Systems, Vol. 9. pp. 319325. MIT Press, Cambridge,
Massachusetts.
Bancilhon, F. Maier, D., Sagiv, Y., and Ullman, J. D. (1986). Magic sets and other strange ways to implement
logic programs. In Proceedings of the Fifth ACM Symposium on Principles of Database Systems, pp. 116. New
York. ACM Press.
Bar-Hillel, Y. (1954). Indexical expressions. Mind, 63, 359379.
Bar-Hillel, Y. (1960). The present status of automatic translation of languages. In Alt, F. L. (Ed.), Advances in
Computers, Vol. 1, pp. 91163. Academic Press, New York.
Bar-Shalom, Y. (Ed.). (1972). Multitarget-multisensor tracking: Advanced applications. Artech House,
Norwood, Massachusetts.
Bar-Shalom, Y. and Fortmann, T. E. (1988). Tracking and Data Association. Academic Press, New York.
Barrett, A. and Weld, D. S. (1994). Task-decomposition via plan parsing. In Proceedings of the Twelfth
National Conference on Artificial Intelligence (AAAI-94), pp. 11171122, Seattle. AAAI Press.
Bartak, R. (2001). Theory and practice of constraint propagation. In Proceedings of the Third Workshop on
Constraint Programming for Decision and Control (CPDC-01), pp. 714, Gliwice, Poland.
Barto, A. G. Bradtke, S. J., and Singh, S. P. (1995). Learning to act using real-time dynamic programming.
Artificial Intelligence, 73(1), 81138.
Barto, A. G., Sutton, R. S., and Anderson, C. W. (1983). Neuronlike adaptive elements that can solve difficult
learning control problems. IEEE Transactions on Systems, Man and Cybernetics, 13, 834846.
Barto, A. G., Sutton, R. S., and Brouwer, P. S. (1981). Associative search network: A reinforcement learning
associative memory. Biological Cybernetics, 40(3), 201211.
Barton, G. E. Berwick, R. C., and Ristad, E. S. (1987). Computational Complexity and Natural Language. MIT
Press, Cambridge, Massachusetts.
Barwise, J. and Etchemendy, J. (1993). The Language of First-Order Logic: Including the Macintosh Program
Tarskis World 4.0 (Third Revised and Expanded edition). Center for the Study of Language and Information
(CSLI), Stanford, California.
Bateman, J. A. (1997). Enabling technology for multilingual natural language generation: The KPML
development environment. Natural Language Engineering, 3(1), 1555.
Bateman, J. A., Kasper, R. T., Moore, J. D., and Whitney, R. A. (1989). A general organization of knowledge
for natural language proecessing: The penman upper model. Tech. rep., Information Sciences Institute, Marina
del Rey, CA.
Baum, E., Boneh, D., and Garrett, C. (1995). On genetic algorithms. In Proceedings of the Eighth Annual
Conference on Computational Learning Theory (COLT-92), pp. 230239, Santa Cruz, California. ACM Press.
Baum, E. and Haussler, D. (1989). What size net gives valid generalization?. Neural Computation, 1(1), 151
160.
Baum, E. and Smith, W. D. (1997). A Bayesian approach to relevance in game playing. Artificial Intelligence,
97(12), 195242.
Baum, E. and Wilczek, F. (1988). Supervised learning of probability distributions by neural networks. In
Anderson, D. Z. (Ed.), Neural Information Processing Systems, pp. 5261. American Institute of Physics, New
York.
868
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Baum, L. E. and Petrie, T. (1966). Statistical inference for probabilistic functions of finite state Markov chains.
Annals of Mathematical Statistics, 41.
Baxter, J. and Bartlett, P. (2000). Reinforcement learning in POMDPs via direct gradient ascent. In
Proceedings of the Seventeenth International Conference on Machine Learning, pp. 4148, Standford,
California. Morgan Kaufmann.
Bayardo, R. J. and Schrag, R. C. (1997). Using CSP look-back techniques to solve real-world SAT instances. In
Proceedings of the Fourteenth National Conference on Artificial Intelligence (AAAI-97). pp. 203208.
Providence, Rhode Island. AAAI Press.
Bayes, T. (1763). An essay towards solving a problem in the doctrine of chances. Philosophical Transactions of
the Royal Society of London, 53, 370418.
Beal, D. F. (1980). An analysis of minimax. In Clarke, M. R. B. (Ed.). Advances in Computer Chess 2, pp. 103
109. Edinburgh University Press, Edinburgh, Scotland.
Beal, D. F. (1990). A generalised quiescence search algorithm. Artificial Intelligence, 43(1), 8598.
Beckert, B. and Posegga, J. (1995). Leantap: Lean, tableau-based deduction. Journal of Automated Reasoning,
15(3), 339358.
Beeri, C. Fagin, R., Maier, D., and Yannakakis, M. (1983). On the desirability of acyclic database schemes.
Journal of the Association for Computing Machinery, 30(3), 479513.
Bell, C. and Tate, A. (1985). Using temporal constraints to restrict search in a planner. In Proceedings of the
Third Alvey IKBS SIG Workshop, Sunningdale, Oxfordshire, UK. Institution of Electrical Engineers.
Bell, J. L. and Machover, M. (1977). A Course in Mathematical Logic. Elservier/North-Holland, Amsterdam,
London, New York.
Bellman, R. E. (1978). An Introduction to Artificial Intelligence: Can Computers Think? Boyd & Fraser
Publishing Company, San Francisco.
Bellman, R. E. and Dreyfus, S. E. (1962). Applied Dynamic Programming. Princeton University Press,
Princeton, New Jersey.
Bellman, R. E. (1957). Dynamic Programming. Princeton University Press, Princeton, New Jersey.
Belongie, S., Malik, J., and Puzicha, J. (2002). Shape matching and object recognition using shape contexts.
IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI), 24(4), 509522.
Bender, E. A. (1996). Mathematical methods in artificial intelligence. IEEE Computer Society Press, Los
Alamitos, California.
Bentham, J. (1823). Principles of Morals and Legislation. Oxford University Press, Oxford, UK. Original work
published in 1789.
Berger, J. O. (1985). Statistical Decision Theory and bayesian Analysis. Springer Verlag, Berlin.
Berlekamp, E. R. Conway, J. H., and Guy, R. K. (1982). Winning Ways, For Your Mathematical Plays.
Academic Press, New York.
Berleur, J. and Brunnstein, K. (2001). Ethics of Computing: Codes, Spaces for Discussion and Law. Chapman
and Hall, London.
Berliner, H. J. (1977), BKG a program that plays backgammon. Tech. rep., Computer Science Department,
Carnegie-Mellon University, Pittsburgh.
Berliner, H. J. (1979). The B* tree search algorithm: A best-first proof procedure. Artificial Intelligence, 12(1),
2340.
869
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Berliner, H. J. (1980a). Backgammon computer program beats world champion. Artificial Intelligence, 14,
205220.
Berliner, H. J. (1980b). Computer backgammon. Scientific American, 249(6), 6472.
Berliner, H. J. and Ebeling, C. (1989). Pattern knowledge and search: The SUPREM architecture. Artificial
Intelligence, 38(2), 161198.
Bernardo, J. M. and Smith, A. F. M. (1994). Bayesian Theory. Wiley, New York.
Berners-Lee, T. Hendler, J., and Lassila, O. (2001). The semantic web. Scientific American, 284(5), 3443.
Bernoulli, D. (1738). Specimen theoriae novae de mensura sortis. Proceedings of the St. Petersburg Imperial
Academy of Sciences, 5, 175192.
Bernstein, A. and Roberts, M. (1985). Computer vs. chess player. Scientific American, 198(6), 96105.
Bernstein, A., Roberts, M., Arbuckle, T., and Belsky, M. S. (1958). A chess playing program for the IBM 704.
In Proceedings of the 1958 Western Joint Computer Conference, pp. 157159, Los Angeles. American Institute
of Electrical Engineers.
Bernstein, P. L. (1996). Against the Odds: The Remarkable Story of Risk. Wiley, New York.
Berrou, C., Glavieux, A., and Thitimajshima, P. (1993). Near Shannon limit error control-correcting coding and
decoding: Turbo-codes. I. In Proc. IEEE International Conference on Communications, pp. 10641070,
Geneva, Switzerland. IEEE.
Berry, D. A. and Fristedt, B. (1985). Bandit Problems: Sequential Allocation of Experiments. Chapman and
Hall, London.
Bertele, U. and Brioschi, F. (1972). Nonserial dynamic programming. Academic Press, New York.
Bertoli, P. Cimatti, A., and Roveri, M. (2001a). Heuristic search + symbolic modell checking = efficient
conformant planning. In Proceedings of the Seventeenth International Joint Conference on Artificial
Intelligence (IJCAI-01), pp. 467472. Seattle, Morgan Kaufmann.
Bertoli, P. Cimatti, A., Roveri, M., and Traverso, P. (2001b). Planning in nondeterministic domains under
partial observability via symbolic model checking. In Proceedings of the Seventeenth International Joint
Conference on Artificial Intelligence (IJCAI-01), pp. 473478. Seattle. Morgan Kaufmann.
Bertsekas, D. (1987). Dynamic Programming: Deterministic and Stochastic Models. Prentice-Hall, Upper
Saddle River, New Jersey.
Bertsekas, D. and Tsitsiklis, J. N. (1996). Neurodynamic programming. Athena Scientific, Belmont,
Massachusetts.
Bertsekas, D. and Tsitsiklis, J. N. (2002). Introduction to Probability. Athena Scientific, Belmont,
Massachusetts.
Bibel, W. (1981). On matrices with connections. Journal of the Association for Computing Machinery, 28(4),
633645.
Bibel, W. (1993). Deduction: Automated Logic. Academic Press, London.
Biggs, N. L., Lloyd, E. K., and Wilson, R. J. (1986). Graph Theory 17361936. Oxford University Press,
Oxford, UK.
Binder, J., Koller, D., Russelll, S. J., and Kanazawa, K. (1997a). Adaptive probabilistic networks with hidden
variables. Machine Learning, 29, 213244.
Binder, J. Murphy, K., and Russel, S. J. (1997b). Space-efficient inference in dynamic probabilistic networks.
In Proceedings of the Fifteenth International Joint Conference on Artificial Intelligence (IJCAI-97), pp. 1292
1296, Nagoya, Japan. Morgan Kaufmann.
870
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Binford, T. O. (1971). Visual perception by computer. Invited paper presented at the IEEE Systems Science and
Cybernetics Conference, Miami.
Binmore, K. (1982). Essays on Foundations of Game Theory. Pitman, London.
Birnbaum, L. and Selfridge, M. (1981). Conceptual analysis of natural language. In Schank, R. and Riesbeck,
C. (Eds.), Inside Computer Understanding. Lawrence Erlbaum, Potomac, Maryland.
Biro, J. I. and Shahan, R. W. (Eds.) (1982). Mind, Brain and Function: Essays in the Philosophy of Mind.
University of Oklahoma Press, Norman, Oklahoma.
Birtwistle, G. Dahl, O.-J., Myrhaug, B. and Nygaard, K. (1973). Simula Begin. Studentliteratur (Lund) and
Auerbach, New York.
Bishop, C. M. (1995). Neural Networks for Pattern Recognition. Oxford University Press, Oxford, UK.
Bistarelli, S. Montanari, U., and Rossi, F. (1997). Semiring-based constraint satisfaction and optimization.
Journal of the Association for Computing Machinery, 44(2), 201236.
Bitner, J. R. and Reingold, E. M. (1975). Backtrack programming techniques. Communications of the
Association for Computing Machinery, 18(11), 651656.
Blei, D. M., Ng, A. Y., and Jordan, M. I. (2001). Latent Dirichlet Allocation. In Neural Information Processing
Systems, Vol. 14, Cambridge, Massachusetts, MIT Press.
Blinder, A. S. (1983). Issues in the coordination of monetary and fiscal policies. In Monetary Policy Issues in
the 1980s. Federal Reserve Bank, Kansas City, Missouri.
Block, N. (ed.) (1980). Readings in Philosophy of Psychology, Vol. 1. Harvard University Press, Cambridge,
Massachusetts.
Blum, A. L. and Furst, M. (1995). Fast planning through planning graph analysis. In Proceedings of the
Fourteenth International Joint Conference on Artificial Intelligence (IJCAI-95), pp. 16361642, Montreal
Morgan Kaufmann.
Blum, A. L. and Furst, M. (1997). Fast planning through planning graph analysis. Artificial Intelligence, 90(1
2), 281300.
Blumer, A., Ehrenfeucht, A., Haussler, D., and Warmuth, M. (1989). Learnability and the VapnikChervonenkis dimension. Journal of the Association for Computing Machinery, 36(4), 929965.
Bobrow, D. G. (1967). Natural language input for a computer problem solving system. In Minsky, M. L. (Ed.),
Semantic Information Processing, pp. 133215. MIT Press, Cambridge, Massachusetts.
Bobrow, D. G., Kaplan, R., Kay, M., Norman, D. A., Thompson, H., and Winograd, T. (1977). GUS, a frame
driven dialog system. Artificial Intelligence, 8, 155173.
Bobrow, D. G. and Raphael, B. (1974). New programming languages for artificial intelligence research.
Computing Surveys, 6(3), 153174.
Boden, M. A. (1977). Artificial Intelligence and Natural Man. Basic Books, New York.
Boden, M. A. (Ed.) (1990). The Philosophy of Artificial Intelligence, Oxford University Press, Oxford, UK.
Bonet, B. and Geffner, H. (1999). Planning as heuristic search: New results. In Proceedings of the European
Conference on Planning, pp. 360372, Durham, UK. Springer-Verlag.
Bonet, B. and Geffner, H. (2000). Planning with incomplete information as heuristic search in belief space. In
Chien, S., Kambhampati, S., and Knoblock, C. A. (Eds.), International Conference on Artificial Intelligence
Planning and Scheduling, pp. 5261, Menlo Park, California. AAAI Press.
Boole, G. (1847). The Mathematical Analysis of Logic: Being an Essay towards a Calculus of Deductiva
Reasoning. Macmillan, Barclay, and Macmillan, Cambridge.
871
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Boolos, G. S. and Jeffrey, R. C. (1989). Computability and Logic (3rd edition). Cambridge University Press,
Cambridge, UK.
Booth, T. L. (1969). Probabilistic representation of formal languages. In IEEE Conference Record of the 1969
Tenth Annual Symposium on Switching and Automata Theory, pp. 7481, Waterloo, Ontario. IEEE.
Borel, E. (1921). La thorie du jeu et les quations intgrales noyau symtrique. Comptes Rendus
Hebdomadaires des Sances de lAcadmie des Sciences, 173, 13041308.
Borenstein, J., Everett, B., and Feng, L. (1996). Navigating Mobile Robots: Systems and Techniques. A. K.
Peters, Ltd., Wellesley, MA.
Borenstein, J. and Koren., Y. (1991). The vector field histogramfast obstacle avoidance for moile robots. IEEE
Transactions on Robotics and Automation, 7(3), 278288.
Borgida, A., Brachman, R. J., McGuinness, D. L., and Alperin Resnick, L. (1989). CLASSIC: A structural data
model for objects. SIGMOD Record, 18(2), 5867.
Boser, B. E. Guyon, I. M. and Vapnik, V. N. (1992). A training algorithm for optimal margin classifiers. In
Proceedings of the Fifth Annual ACM Workshop on Computational Learning Theory (COLT-92), Pittsburgh,
Pennsylvania. ACM Press.
Boutilier, C. and Brafman, R. I. (2001). Partial-order planning with concurrent interacting actions. Journal of
Artificial Intelligence Research, 14, 105136.
Boutilier, C., Dearden, R., and Goldszmidt, M. (2000). Stochastic dynamic programming with factored
representations. Artificial Intelligence, 121, 49107.
Boutilier, C. Reiter, R., and Price, B. (2001). Symbolic dynamic programming for first-order MDPs. In
Proceedings of the Seventeenth International Joint Conference on Artificial Intelligence (IJCAI-01), pp. 467
472, Seattle, Morgan Kaufmann.
Boutilier, C., Reiter, R., Soutchanski, M., and Thrun, S. (2000). Decision-theoretic, high-level agent
programming in the situation calculus. In Proceedings of the Seventeenth National Conference on Artificial
Intelligence (AAAI-00), pp. 355362, Austin, Texas. AAAI Press.
Box, G. E. P. (1957). Evolutionary operation: A method of increasing industrial productivity. Applied Statistics,
6, 81101.
Boyan, J. A. (2002). Technical update: Least-squares temporal difference learning. Machine Learning, 49(23),
233246.
Boyan, J. A. and Moore, A. W. (1998). Learning evaluation functions for global optimization and Boolean
satisfiability. In Proceedings of the Fifteenth National Conference on Artificial Intelligence (AAAI-98),
Madison, Wisconsin. AAAI Press.
Boyen, X., Friedman, N., and Koller, D. (1999). Discovering the hidden structure of complex dynamic systems.
In Uncertainty in Artificial Intelligence: Proceedings of the Fifteenth Conference, Stockholm. Morgan
Kaufmann.
Boyer, R. S. and Moore, J. S. (1979). A Computational Logic. Academic Press, New York.
Boyer, R. S. and Moore, J. S. (1984). Proof checking the RSA public key encryption algorithm. American
Mathematical Monthly, 91(3), 181189.
Brachman, R. J. (1979). On the epistemological status of semantic networks. In Findler, N. V. (Ed.),
Associative Networks: Representation and Use of Knowledge by Computers, pp. 350. Academic Press, New
York.
Brachman, R. J., Fikes, R. E., and Levesque, H. J. (1983). Krypton: A functional approach to knowledge
representation. Computer, 16(10), 6773.
872
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
873
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
874
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Burstein, J., Leacock, C., and Swartz, R. (2001). Automated evaluation of essays and short answers. In Fifth
International Computer Assisted Assessment (CAA) Conference, Loughborough, U.K. Loughborough
University.
Bylander, T. (1992). Complexity results for serial decomposability. In Proceedings of the Tenth National
Conference on Artificial Intelligence (AAAI-92), pp. 729734, San Jose. AAAI Press.
Bylander, T. (1994). The computational complexity of propositional strips planning. Artificial Intelligence, 69,
165204.
Calvanese, D., Lenzerini, M., and Nardi, D. (1999). Unifying class-based representation formalism. Journal of
Artificial Intelligence Research, 11, 199240.
Campbell, M. S., Hoane, A. J., and Hsu, F.-H. (2002). Deep Blue. Artificial Intelligence, 134(12), 5783.
Canny, J. and Reif, J. (1987). New lower bound techniques for robot motion planning problems. In IEEE
Symposium on Foundations of Computer Science, pp. 3948.
Canny, J. (1986). A computational approach to edge detection. IEEE Transactions on Pattern Analysis and
Machine Intelligence (PAMI), 8, 679698.
Canny, J. (1988). The Complexity of Robot Motion Planning. MIT Press. Cambridge, Massachusetts.
Carbonell, J. G. (1983). Derivational analogy and its role in problem solving. In Proceedings of the National
Conference on Artificial Intelligence (AAAI-83), pp. 6469, Washington, DC. Morgan Kaufmann.
Carbonell, J. G. Knoblock, C. A., and Minton, S. (1989). PRODIGY: An integrated architecture for planning
and learning. Technical report CMU-CS-89-189, Computer Science Department, Carnegie-Mellon University,
Pittsburgh.
Carbonell, J. R. and Collins, A. M. (1973). Natural semantics in artificial intelligence. In Proceedings of the
Third International Joint Conference on Artificial Intelligence (IJCAI-73), pp. 344351, Stanford, California.
IJCAII.
Carnap, R. (1928). Der logische Aufbau der Welt. Weltkreis-verlag, Berlin-Schlachtensee. Translated into
English as (Carnap, 1967).
Carnap, R. (1948). On the application of inductive logic. Philosophy and Phenomenological Research, 8, 133
148.
Carnap, R. (1950). Logical Foundations of Probability. University of Chicago Press, Chicago.
Carrasco, R. C., Oncina, J., and Calera, J. (1998). Stochastic Inference of Regular Tree Languages, Vol. 1433
of Lecture Notes in Computer Science. Springer-Verlag, Berlin.
Cassandra, A. R. Kaelbling, L., P., and Littman, M. L. (1994). Acting optimally in partially observable
stochastic domains. In Proceedings of the Twelfth National Conference on Artificial Intelligence (AAAI-94), pp.
10231028. Seattle. AAAI Press.
Ceri, S., Gottlob, G., and Tanca, L. (1990). Logic programming and databases. Springer-Verlag, Berlin.
Chakrabarti, P. P., Ghose, S., Acharya, A., and de Sarkar, S. C. (1989). Heuristic search in restricted memory.
Artificial Intelligence, 41(2), 197222.
Chan, W. P., Prete, F., and Dickinson, M. H. (1998). Visual input to the efferent control system of a flys
gyroscope. Science, 289, 289292.
Chandra, A. K. and Harel, D. (1980). Computable queries for relational data bases. Journal of Computer and
System Sciences, 21(2), 156178.
Chandra, A. K. and Merlin, P. M. (1977). Optimal implementation of conjunctive queries in relational
databases. In Proceedings of the 9th Annual ACM Symposium on Theory of Computing, pp. 7790, New York.
ACM Press.
875
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Chang, C.-L. and Lee, R. C.-T. (1973). Symbolic Logic and Mechanical Theorem Proving. Academic Press,
New York.
Chapman, D. (1987). Planning for conjunctive goals. Artificial Intelligence, 32(3), 333377.
Charniak, E. (1993). Statistical Language Learning. MIT Press, Cambridge, Massachusetts.
Charniak, E. (1996). Tree-bank grammars. In Proceedings of the Thirteenth National Conference on Artificial
Intelligence (AAAI-96), pp. 10311036, Portland, Oregon. AAAI Press.
Charniak, E. (1997). Statistical parsing with a context-free grammar and word statistics. In Proceedings of the
Fourteenth National Conference on Artificial Intelligence (AAAI-97), pp. 598603, Providence, Rhode Island.
AAAI Press.
Charniak, E. and Goldman, R. (1992). A Bayesian model of plan recognition. Artificial Intelligence, 64(1) 53
79.
Charniak, E. and McDermott, D. (1985). Introduction to Artificial Intelligence. Addison-Wesley, Reading,
Massachusetts.
Charniak, E., Riesbeck, C., McDermott, D., and Meehan, J. (1987). Artificial Intelligence Programming (2nd
edition). Lawrence Erlbaum Associates, Potomac, Maryland.
Chatfield, C. (1989). The Analysis of Time Series: An Introduction (4th edition). Chapman and Hall, London.
Cheeseman, P. (1985). In defense of probability. In Proceedings of the Ninth International Joint Conference on
Artificial Intelligence (IJCAI-85), pp. 10021009, Los Angeles, Morgan Kaufmann.
Cheeseman, P. (1988). An inquiry into computer understanding. Computational Intelligence, 4(1), 5866.
Cheeseman, P., Kanefsky, B., and Taylor, W. (1991). Where the really hard problems are. In Proceedings of the
Twelfth International Joint Conference on Artificial Intelligence (IJCAI-91), pp. 331337, Sydney. Morgan
Kaufmann.
Cheeseman, P., Self, M., Kelly, J., and Stutz, J. (1988). Bayesian classification. In Proceedings of the Seventh
National Conference on Artificial Intelligence (AAAI-88), Vol. 2, pp. 607611, St. Paul, Minnesota, Morgan
Kaufmann.
Cheeseman, P. and Stutz, J. (1996). Bayesian classification (AutoClass): Theory and results. In Fayyad, U.,
Piatesky-Shapiro, G., Smyth, P., and Uthurusamy, R. (Eds.), Advances in Knowledge Discovery and Data
Mining. AAAI Press/MIT Press, Menlo Park, California.
Cheng, J. and Druzdzel, M. J. (2000). AIS-BN: An adaptive importance sampling algorithm for evidential
reasoning in large Bayesian networks. Journal of Artificial Intelligence Research, 13, 155188.
Cheng, J. Greiner, R., Kelly, J., Bell, D. A., and Liu, W. (2002). Learning Bayesian networks from data: An
information-theory based approach. Artificial Intelligence, 137, 4390.
Chierchia, G. and McConnell-Ginet, S. (1990). Meaning and Grammar. MIT Press, Cambridge, Massachusetts.
Chomsky, N. (1956). Three models for the description of language. IRE Transactions on Information Theory,
2(3), 113124.
Chomsky, N. (1957). Syntactic Structures. Mouton, The Hague and Paris.
Chomsky, N. (1980). Rules and representations. The Behavioral and Brain Sciences, 3, 161.
Choset, H. (1996). Sensor Based Motion Planning: The Hierarchical Generalized Voronoi Graph. Ph.D. thesis,
California Institute of Technology.
Chung, K. L. (1979). Elementary Probability Theory with Stochastic Processes (3rd edition). Springer-Verlag,
Berlin.
876
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Church, A. (1936). A note on the Entscheidungsproblem. Journal of Symbolic Logic, 1, 4041 and 101102.
Church, K. and Patil, R. (1982). Coping with syntactic ambiguity or how to put the block in the box on the
table. American Journal of Computational Linguistics, 8(34), 139149.
Church, K. and Gale, W. A. (1991). A comparison of the enhanced Good-Turing and deleted estimation
methods for estimating probabilities of English bigrams. Computer Speech and Language, 5, 1954.
Churchland, P. M. (1979). Scientific Realism and the Plasticity of Mind. Cambridge University Press,
Cambridge, UK.
Churchland, P. M. and Churchland, P. S. (1982). Functionalism, qualia, and intentionality. In Biro, J. I. and
Shahan, R. W. (Eds.), Mind, Brain and Function: Essays in the Philosophy of Mind, pp. 121145. University of
Oklahoma Press, Norman, Oklahoma.
Churchland, P. S. (1986). Neurophilosophy: Toward a Unifed Science of the MindBrain. MIT Press,
Cambridge, Massachusetts.
Cimatti, A., Roveri, M., and Traverso, P. (1998). Automatic OBDD-based generation of universal plans in nondetermistic domains. In Proceedings of the Fifteenth National Conference on Artificial Intelligence (AAAI-98),
pp. 875881, Madison, Wisconsin. AAAI Press.
Clark, K. L. (1978). Negation as failure. In Gallaire, H. and Minker, J. (Eds.), Logic and Data Bases, pp. 293
322. Plenum, New York.a
Clark, P. and Niblett, T. (1989). The CN2 induction algorithm. Machine Learning, 3, 261283.
Clarke, A. C. (1968a). 2001: A Space Odyssey. Signet.
Clarke, A. C. (1968b). The world of 2001. Vogue.
Clarke, E. and Grumberg, O. (1987). Research on automtic verification of finite-state concurrent systems.
Annual Review of Computer Science, 2, 269290.
Clarke, E. Grumberg, O., and Peled, D. (1999). Model Checking. MIT Press, Cambridge, Massachusetts.
Clarke, M. R. B. (Ed.). (1977). Advances in Computer Chess 1. Edinburgh University Press, Scotland.
Clearwater, S. H. (Ed.). (1996). Market-Based Control. World Scientific, Singapore and Teneck, New Jersey.
Clocksin, W. F. and Mellish, C. S. (1994). Programming in Prolog (4th edition). Springer-Verlag, Berlin.
Clowes, M. B. (1971). On seeing things. Artificial Intelligence, 2(1), 79116.
Cobham, A. (1964). The intrinsic computational difficulty of functions. In Bar-Hillel, Y. (Ed.), Proceedings of
the 1964 International Congress for Logic, Methodology, and Philosophy of Science, pp. 2430, Jerusalem.
Elsevier/North-Holland.
Cobley, P. (1997). Introducting Semiotics. Totem Books, New York.
Cohen, J. (1988). A view of the origins and development of PROLOG. Communications of the Association for
Computing Machinery, 31, 2636.
Cohen, P. R. (1995). Empirical methods for artificial intelligence. MIT Press, Cambridge, Massachusetts.
Cohen, P. R. and Levesque, H. J. (1990). Intention is choice with commitment. Artificial Intelligence, 42(23),
213261.
Cohen, P. R., Morgan, J., and Pollack, M. E. (1990). Intentions in Communication. MIT Press, Cambridge,
Massachusetts.
Cohen, P. R. and Perrault, C. R. (1979). Elements of a plan-based theory of speech acts. Cognitive Science,
3(3), 177212.
877
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Cohen, W. W. and Page, C. D. (1995). Learnability in inductive logic programming: Methods and results. New
Generation Computing, 13(34), 369409.
Cohn, A. G. Bennett, B., Gooday, J. M., and Gotts, N. (1997). RCC: A calculus for region based qualitative
spatial reasoning. GeoInformatica, 1, 275316.
Collins, M. J. (1996). A new statistical parser based on bigram lexical dependencies. In Joshi, A. K. and Palmer,
M. (Eds.), Proceedings of the Thirty-Fourth Annual Meeting of the Association for Computational Linguistics,
pp. 184191, San Francisco, Morgan Kaufmann Publishers.
Collins, M. J. (1999). Head-driven Statistical Models for Natural Language Processing. Ph.D. thesis,
University of Pennsylvania.
Collins, M. and Duffy, K. (2002). New ranking algorithms for parsing and tagging: Kernels over discrete
structures, and the voted perceptron. In Proceedings of the ACL.
Colmerauer, A. (1975). Les grammaires de metamorphose. Tech. rep., Groupe dIntelligence Artificielle,
Universit de Marsaille-Luminy.
Colmerauer, A., Kanoui, H., Pasero, R., and Roussel, P. (1973). Un systme de communication homme
machine en Franais. Rapport, Groupe dIntelligence Artificielle, Universit dAix-Marseille II.
Condon, J. H. and Thompson, K. (1982). Belle chess harware. In Clarke, M. R. B. (Ed.), Advances in Computer
Chess 3, pp. 4554. Pergamon, Oxford, UK.
Congdon, C. B., Huber, M., Kortenkamp, D., Bidlack, C., Cohen, C., Huffman, S., Koss, F., Raschke, U., and
Weymouth, T. (1992). CARMEL versus Flakey: A comparison of two robots. Tech. rep. Papers from the AAAI
Robot Competition, RC-92-01, American Association for Artificial Intelligence, Menlo Park, CA.
Connell, J. (1989). A Colony Architecture for an Artificial Creature. Ph.D. thesis, Artificial Intelligence
Laboratory, MIT, Cambridge, MA. also available as AI Technical Report 1151.
Cook, S. A. (1971). The complexity of theorem-proving procedures. In Proceedings of the 3rd Annual ACM
Symposium on Theory of Computing, pp. 151158, New York. ACM Press.
Cook, S. A. and Mitchell, D. (1997). Finding hard instances of the satisfiability problem: A survey. In Du, D.,
Gu, J., and Pardalos, P. (Eds.), Satisfiability problems: Theory and applications. American Mathematical
Society, Providence, Rhode Island.
Cooper, G. (1990). The computational complexity of probabilistic inference using Bayesian belief networks.
Artificial Intelligence, 42, 393405.
Cooper, G. and Herskovits, E. (1992). A Bayesian method for the induction of probabilistic networks from data.
Machine Learning, 9, 309347.
Copeland, J. (1993). Artificial Intelligence: A Philosophical Introduction. Blackwell, Oxford, UK.
Copernicus (1543). De Revolutionibus Orbium Coelestium. Apud Ioh. Petreium, Nuremberg.
Cormen, t. H., Leiserson, C. E., and Rivest, R. (1990). Introduction to Algorithms. MIT Press, Cambridge,
Massachusetts.
Cortes, C. and Vapnik, V. N. (1995). Support vector networks. Machine Learning, 20, 273297.
Cournot, A. (Ed.) (1838). Recherches sur les principes mathmatiques de la thorie des richesses. L. Hachette,
Paris.
Covington, M. A., (1994). Natural Language Processing for Prolog Programmers. Prentice-Hall, Upper Saddle
River, New Jersey.
Cowan, J. D. and Sharp, D. H. (1988a). Neural nets. Quarterly Reviews of Biophysics, 21, 365427.
Cowan, J. D. and Sharp, D. H. (1988b). Neural nets and artificial intelligence. Daedalus, 117, 85121.
878
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Cox, I. (1993). A review of statistical data association techniques for motion correspondence. International
Journal of Computer Vision, 10, 5366.
Cox, I. and Hingorani, S. L. (1994). An efficient implementation and evaluation of Reids multiple hypothesis
tracking algorithm for visual tracking. In Proceedings of the 12th International Conference on Pattern
Recognition, Vol. 1, pp. 437442, Jerusalem, Israel. International Association for Pattern Recognition (IAPR).
Cox, I. and Wilfong, G. T. (Eds.). (1990). Autonomous Robot Vehicles. Springer-Verlag, Berlin.
Cox, R. T. (1946). Probability, frequency, and reasonable expectation. American Journal of Physics, 14(1), 1
13.
Craig, J. (1989). Introduction to Robotics: Mechanics and Control (2nd Edition). Addison-Wesley Publishing,
Inc., Reading, MA.
Craik, K. J. (1943). The Nature of Explanation. Cambridge University Press, Cambridge, UK.
Crawford, J. M. and Auton, L. D. (1993). Experimental results on the crossover point in satisfiability problems.
In Proceedings of the Eleventh National Conference on Artificial Intelligence (AAAI-93), pp. 2127,
Washington, DC. AAAI Press.
Cristianini, N. and Schlkopf, B. (2002). Support vector machines and kernel methods: The new generation of
learning machines. AI Magazine, 23(3), 3141.
Cristianini, N. and Shawe-Taylor, J. (2000). An introduction to support vector machines and other kernelbased learning methods. Cambridge University Press, Cambridge, UK.
Crockett, L. (1994). The Turing Test and the Frame Problem: AIs Mistaken Understanding of Intelligence.
Ablex, Norwood, New Jersey.
Cross, S. E. and Walker, E. (1994). Dart: Applying knowledge based planning and scheduling to crisis action
planning. In Zweben, M. and Fox, M. S. (Eds.), Intelligent Scheduling, pp. 711729. Morgan Kaufmann, San
Mateo, California.
Cruse, D. A. (1986). Lexical Semantics. Cambridge University Press.
Culberson, J. and Schaeffer, J. (1998). Pattern databases. Computational Intelligence, 14(4), 318334.
Cullingford, R. E. (1981). Integrating knowledge sources for computer understanding tasks. IEEE
Transactions on Systems, Man and Cybernetics (SMC), 11.
Cussens, J. and Dzeroski, S. (2000). Learning Language in Logic, Vol. 1925 of Lecture Notes in Computer
Science. Springer-Verlag, Berlin.
Cybenko, G. (1988). Continuous valued neural networks with two hidden layers are sufficient. Technical report,
Department of Computer Science, Tufts University, Medford, Massachusetts.
Cybenko, G. (1989). Approximation by superpositions of a sigmoidal function. Mathematics of Controls,
Signals, and Systems, 2, 303314.
Daganzo, C. (1979). Multinomial probit: The theory and its application to demand forecasting. Academic
Press, New York.
Dagum, P. and Luby, M. (1993). Approximating probabilistic inference in Bayesian belief networks is NP-hard.
Artificial Intelligence, 60(1), 141153.
Dahl, O.-J., Myrhaug, B., and Nygaard, K. (1970). (Simula 67) common base language. Tech. rep. N. S-22,
Norsk Regnesentral (Norwegian Computing Center), Oslo.
Dale, R., Moisl, H., and Somers, H. (2000). Handbook of Natural Language Processing. Marcel Dekker, New
York.
879
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Dantzig, G. B. (1949). Programming of interdependent activities: II. mathematical model. Econometrica, 17,
200211.
Darwiche, A. (2001). Recursive conditioning. Artificial Intelligence, 126, 541.
Darwiche, A. and Ginsberg, M. L. (1992). A symbolic generalization of probability theory. In Proceedings of
the Tenth National Conference on Artificial Intelligence (AAAI-92), pp. 622627, San Jose. AAAI Press.
Darwin, C. (1859). On The Origin of Species by Means of Natural Selection. J. Murray, London.
Darwin, C. (1871). Descent of Man. J. Murray.
Dasgupta, P., Chakrabarti, P. P., and DeSarkar, S. C. (1994). Agent searching in a tree and the optimality of
iterative deepening. Artificial Intelligence, 71, 195208.
Davidson, D. (1980). Essays on Actions and Events. Oxford University Press, Oxford, UK.
Davies, T. R. (1985). Analogy. Informal note INCSLI-85-4, Center for the Study of Language and Information
(CSLI), Stanford, California.
Davies, T. R. and Russell, S. J. (1987). A logical approach to reasoning by analogy. In Proceedings of the Tenth
International Joint Conference on Artificial Intelligence (IJCAI-87), Vol. 1, pp. 264270. Milan. Morgan
Kaufmann.
Davis, E. (1986). Representing and Acquiring Geographic Knowledge. Pitman and Morgan Kaufmann, London
and San Mateo, California.
Davis, E. (1990). Representations of Commonsense Knowledge. Morgan Kaufmann, San Mateo, California.
Davis, K. H., Biddulph, R., and Balashek, S. (1952). Automatic recognition of spoken digits. Journal of the
Acoustical Society of America, 24(6), 637642.
Davis, M. (1957). A computer program for Presburgers algorithm. In Robinson, A. (Ed.), Proving Theorems
(as Done by Man, Logician, or Machine), pp. 215233, Cornell University, Ithaca, New York. Communications
Research Division, Institute for Defense Analysis. Proceedings of the Summer Institute for Symbolic Logic.
Second edition; publication date is 1960.
Davis, M., Logemann, G., and Loveland, D. (1962). A machine program for theorem-proving. Communications
of the Association for Computing Machinery, 5, 394397.
Davis, M. and Putnam, H. (1960). A computing procedure for quantification theory. Journal of the Association
for Computing Machinery, 7(3), 201 215.
Davis, R. and Lenat, D. B. (1982). Knowledge-Based Systems in Artificial Intelligence. McGraw-Hill, New
York.
Dayan, P. (1992). The convergence of TD() for general . Machine Learning, 8(34), 341362.
Dayan, P. and Abbott, L. F. (2001). Theoretical Neuroscience: Computational and Mathematical Modeling of
Neural Systems. MIT Press, Cambridge, Massachusetts.
de Dombal, F. T., Leaper, D. J., Horrocks, J. C., and Staniland, J. R. (1974). Human and computer-aided
diagnosis of abdominal pain: Further report with emphasis on performance of clinicians. British Medical
Journal, 1, 376380.
de Dombal, F. T., Staniland, J. R., and Clamp, S. E. (1981). Geographical variation in disease presentation.
Medical Decision Making, 1, 5969.
de Finetti, B. (1937). Le prvision: ses lois logiques, ses sources subjectives. Ann. Inst. Poincar, 7, 168.
de Freitas, J. F. G., Niranjan, M., and Gee, A. H. (200). Sequential Monte Carlo methods to train neural
network models. Neural Computation, 12(4), 933953.
880
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
de Kleer, J. (1975). Qualitative and quantitative knowledge in classical mechanics. Tech. rep. AI-TR-352, MIT
Artificial Intelligence Laboratory.
de Kleer, J. (1986a). An assumption-based TMS. Artificial Intelligence, 28(2), 127162.
de Kleer, J. (1986b). Extending the ATMS. Artificial Intelligence, 28(2), 163196.
de Kleer, J. (1986c). Problem solving with the ATMS. Artificial Intelligence, 28(2), 197224.
de Kleer, J. (1989). A comparison of ATMS and CSP techniques. In Proceedings of the Eleventh International
Joint Conference on Artificial Intelligence (IJCAI-89), Vol. 1, pp. 290296, Detroit. Morgan Kaufmann.
de Kleer, J. and Brown, J. S. (1985). A qualitative physics based on confluences. In Hobbs, J. R. and Moore, R.
C. (Eds.), Formal Theories of the Commonsense World, chap. 4, pp. 109183. Ablex, Norwood, New Jersey.
de Marcken, C. (1996). Unsupervised Language Acquisition. Ph.D. thesis, MIT.
De Morgan, A. (1864). On the syllogism IV and on the logic of relations. Cambridge Philosophical
Transactions, x, 331358.
De Readt, L. (1992). Interactive Theory Revision: An Inductive Logic Programming Approach. Academic
Press, New York.
de Saussure, F. [1910 (republished 1993)]. Lectures on General Linguistics. Pergamon Press, Oxford, UK.
Deacon, T. W. (1997). The symbolic species: The coevolution of language and the brain. W. W. Norton, New
York.
Deale, M., Yvanovich, M., Schnitzius, D., Kautz, D., Carpenter, M., Zweben, M., Davis, G., and Daun, B.
(1994). The space shuttle ground processing scheduling system. In Zweben, M. and Fox, M. (Eds.), Intelligent
Scheduling, pp. 423449. Morgan Kaufmann, San Mateo, California.
Dean, T., Basye, K., Chekaluk, R., and Hyun, S. (1990). Coping with uncertainty in a control system for
navigation and exploration. In Preceedings of the Eighth National Conference on Artificial Intelligence (AAAI90), Vol. 2, pp. 10101015, Boston. MIT Press.
Dean, T. and Boddy, M. (1988). An analysis of time dependent planning. In Proceedings of the Seventh
National Conference on Artificial Intelligence (AAAI-88), pp. 4954, St. Paul, Minnesota. Morgan Kaufmann.
Dean, T., Firby, R. J., and Miller, D. (1990). Hierarchical planning involving deadlines, travel time, and
resources. Computational Intelligence, 6(1), 381398.
Dean, T., Kaelbling, L. P., Kirman, J., and Nicholson, A. (1993). Planning with deadlines in stochastic domains.
In Proceedings of the Eleventh National Conference on Artificial Intelligence (AAAI-93), pp. 574579,
Washington, DC. AAAI Press.
Dean, T. and Kanazawa, K. (1989a). A model for projection and action. In Proceedings of the Eleventh
International Joint Conference on Artificial Intelligence (IJCAI-89), pp. 985990, Detroit. Morgan Kaufmann.
Dean, T. and Kanazawa, K. (1989b). A model for reasoning about persistence and causation. Computational
Intelligence, 5(3), 142150.
Dean, T., Kanazawa, K., and Shewchuk, J. (1990). Prediction, observation and estimation in planning and
control. In 5th IEEE International Symposium on Intelligent Control, Vol. 2, pp. 645650, Los Alamitos, CA.
IEEE Computer Society Press.
Dean, T. and Wellman, M. P. (1991). Planning and Control. Morgan Kaufmann, San Mateo, California.
Debevec, P., Taylor, C., and Malik, J. (1996). Modeling and rendering architecture from photographs: a hybrid
geometry- and image-based approach. In Proceedings. of the 23rd Annual Conference on Computer Graphics
(SIGGRAPH), pp. 1120.
881
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Debreu, G. (1960). Topological methods in cardinal utility theory. In Arrow, K. J., Karlin, S., and Suppes, P.
(Eds.), Mathematical Methods in the Social Sciences, 1959. Stanford University Press, Stanford, California.
Dechter, R. (1990a). Enhancement schemes for constraint processing: Backjumping, learning and cutset
decomposition. Artificial Intelligence, 41, 273312.
Dechter, R. (1990b). On the expressiveness of networks with hidden variables. In Proceedings of the Eighth
National Conference on Artificial Intelligence (AAAI-90), pp. 379385, Boston. MIT Press.
Dechter, R. (1992). Constraint networks. In Shapiro, S. (Ed.), Encyclopedia of Artificial Intelligence (2nd
edition), pp. 276285. Wiley and Sons, New York.
Dechter, R. (1999). Bucket elimination: A unifying framework for reasoning. Artificial Intelligence, 113, 41
85.
Dechter, R. and Frost, D. (1999). Backtracking algorithms for constraint satisfaction problems. Tech. rep.,
Department of Information and Computer Science, University of California, Irvine.
Dechter, R. and Pearl, J. (1985). Generalized best-first search strategies and the optimality of A*. Journal of the
Association for Computing Machinery, 32(3), 505536.
Dechter, R. and Pearl, J. (1987). Network-based heuristics for constraint-satisfaction problems. Artificial
Intelligence, 34(1), 138.
Dechter, R. and Pearl, J. (1989). Tree clustering for constraint networks. Artificial Intelligence, 38(3), 353366.
DeCoste, D. and Scholkopf, B. (2002). Training invariant support vector machines. Machine Learning, 46(1),
161190.
Dedekind, R. (1888). Was sind und was sollen die Zahlen. Braunschweig, Germany.
Deerwester, S. C., Dumais, S. T., Landauer, T. K., Furnas, G. W., and Harshman, r. A. (1990). Indexing by
latent semantic analysis. Journal of the American Society of Information Science, 41(6), 391407.
DeGroot, M. H. (1970). Optimal Statistical Decisions. McGraw-Hill, New York.
DeGroot, M. H. (1989). Probability and Statistics (2nd edition). Addison-Wesley, Reading, Massachusetts.
DeJong, G. (1981). Generalizations based on explanations. In Proceedings of the Seventh International Joint
Conference on Artificial Intelligence (IJCAI-81), pp. 6769, Vancouver, British Columbia. Morgan Kaufmann.
DeJong, G. (1982). An overview of the FRUMP system. In Lehnert, W. and Ringle, M. (Eds.), Strategies for
Natural Language Processing, pp. 149176. Lawrence Erlbaum, Potomac, Maryland.
DeJong, G. and Mooney, R. (1986). Explanation-based learning: An alternative view. Machine Learning, 1,
145176.
Dempster, A. P. (1968). A generalization of Bayesian inference. Journal of the Royal Statistical Society, 30
(Series B), 205247.
Dempster, A. P., Laird, N., and Rubin, D. (1977). Maximum likelihood from incomplete data via the EM
algorithm. Journal of the Royal Statistical Society, 39 (Series B), 138.
Denes, P. (1959). The design and operation of the mechanical speech recognizer at University College London.
Journal of the British Institution of Radio Engineers, 19(4), 219234.
Deng, X. and Papadimitriou, C. H. (1990). Exploring an unknown graph. In Proceedings 31st Annual
Symposium on Foundations of Computer Science, pp. 355361, St. Louis. IEEE Computer Society Press.
Denis, F. (2001). Learning regular languages from simple positive examples. Machine Learning, 44(1/2), 37
66.
Dennett, D. C. (1971). Intentional systems. The Journal of Philosophy, 68(4), 87106.
882
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Dennett, D. C. (1978). Why you cant make a computer that feels pain. Synthese, 38(3).
Dennett, D. C. (1984). Cognitive wheels: the frame problem of AI. In Hookway, C. (Ed.), Minds, Machines,
and Evolution: Philosophical Studies, pp. 129151. Cambridge University Press, Cambridge, UK.
Deo, N. and Pang, C.-Y. (1984). Shortest path algorithms: Taxonomy and annotation. Networks, 14(2), 275
323.
Descartes, R. (1637). Discourse on method. In Cottingham, J., Stoothoff, R., and Murdoch, D. (Eds.), The
Philosophical Writings of Descartes, Vol. I. Cambridge University Press, Cambridge, UK.
Descotte, Y. and Latombe, J.-C. (1985). Making compromises among antagonist constraints in a planner.
Artificial Intelligence, 27, 183217.
Devroye, L. (1987). A course in density estimation. Birkhauser, Boston.
Devroye, L., Gyorfi, L., and Lugosi, G. (1996). A probabilistic theory of pattern recognition. Springer-Verlag,
Berlin.
Dickmanns, E. D. and Zapp, A. (1987). Autonomous high speed road vehicle guidance by computer vision. In
Isermann, R. (Ed.), Automatic Control World Congress, 1987: Selected Papers from the 10th Triennial World
Congress of the International Federation of Automatic Control, pp. 221226, Munich. Pergamon.
Dietterich, T. (1990). Machine Learning. Annual Review of Computer Science, 4, 255306.
Dietterich, T. (2000). Hierarchical reinforcement learning with the MAXQ value function decomposition.
Journal of Artificial Intelligence Research, 13, 227303.
DiGioia, A. M., Kanade, T., and Wells, P. (1996). Final report of the second international workshop on robotics
and computer assisted medical interventions. Computer Aided Surgery, 2, 69101.
Dijkstra, E. W. (1959). A note on two problems in connexion with graphs. Numerische Mathematik, 1, 269
271.
Dissanayake, G., Newman, P., Clark, S., Durrant-Whyte, H., and Csorba, M. (2001). A solution to the
simultaneous localisation and map building (SLAM) problem. IEEE Transactions of Robotics and Automation,
17(3), 229241.
Do, M. B. and Kambhampati, S. (2001). Sapa: A domain-independent heuristic metric temporal planner. In
Proceedings of the European Conference on Planning, Toledo, Spain. Springer-Verlag.
Domingos, P. and Pazzani, M. (1997). On the optimality of the simple Bayesian classifier under zeroone loss.
Machine Learning, 29, 103130.
Doran, C., Egedi, D., Hockey, B. A., Srinivas, B., and Zaidel, M. (1994). XTAG systema wide coverage
grammar of English. In Nagao, M. (Ed.), Proceedings of the 15th COLING, Kyoto, Japan.
Doran, J. and Michie, D. (1966). Experiments with the graph traverser program. Proceedings of the Royal
Society of London, 294, Series A, 235259.
Dorf, R. C. and Bishop, R. H. (1999). Modern Control Systems. Addison-Wesley, Reading, Massachusetts.
Doucet, A. (1997). Monte Carlo methods for Bayesian estimation of hidden Markov models: Application to
radiation signals. Ph.D. thesis, Universit de Paris-Sud, Orsay, France.
Dowling, W. F. and Gallier, J. H. (1984). Linear-time algorithms for testing the satisfiability of propositional
Horn formulas. Journal of Logic Programming, 1, 267284.
Dowty, D., Wall, R., and Peters, S. (1991). Introduction to Montague Semantics. D. Reidel, Dordrecht,
Netherlands.
Doyle, J. (1979). A truth maintenance system. Artificial Intelligence, 12(3), 231272.
883
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Doyle, J. (1983). What is rational psychology? Toward a modern mental philosophy. AI Magazine, 4(3), 5053.
Doyle, J. and Patil, R. (1991). Two theses of knowledge representation: Language restrictions, taxonomic
classification, and the utility of representation services. Artificial Intelligence, 48(3), 261297.
Drabble, B. (1990). Mission scheduling for spacecraft: Diaries of t-sched. In Expert Planning Systems, pp. 76
81, Brighton, UK. Institute of Electrical Engineers.
Draper, D., Hanks, S., and Weld, D. S. (1994). Probabilistic planning with information gathering and
contingent execution. In Proceedings of the Second International Conference on AI Planning Systems, pp. 31
36, Chicago. Morgan Kaufmann.
Dreyfus, H. L. (1972). What Computers Cant Do: A Critique of Artificial Reason. Harper and Row, New York.
Dreyfus, H. L. (1992). What Computers Still Cant Do: A Critique of Artificial Reason. MIT Press, Cambridge,
Massachusetts.
Dreyfus, H. L. and Dreyfus, S. E. (1986). Mind over Machine: The Power of Human Intuition and Expertise in
the Era of the Computer. Blackwell, Oxford, UK.
Dreyfus, S. E. (1969). An appraisal of some shortest-paths algorithms. Operations Research, 17, 395412.
Du, D., Gu, J., and Pardalos, P. M. (Eds.). (1999). Optimization methods for logical inference. American
Mathematical Society, Providence, Rhode Island.
Dubois, D. and Prade, H. (1994). A survey of belief revision and updating rules in various uncertainty models.
International Journal of Intelligent Systems, 9(1), 61100.
Duda, R. O., Gasching, J. and Hart, P. E. (1979). Model design in the Prospector consultant system for mineral
exploration. In Michie, D. (Ed.), Expert Systems in the Microelectronic Age, pp. 153167. Edinburgh University
Press, Edinburgh, Scotland.
Duda, R. O. and Hart, P. E. (1973). Pattern classification and scene analysis. Wiley, New York.
Duda, R. O., Hart, P. E., and Stork, D. g. (2001). Pattern Classification. Wiley, New York.
Dudek, G. and Jenkin, M. (2000). Computational Principles of Mobile Robotics. Cambridge University Press,
Cambridge CB2 2RU, UK.
Durfee, E. H. and Lesser, V. R. (1989). Negotiating task decomposition and allocation using partial global
planning. In Huhns, M. and Gasser, L. (Eds.), Distributed AI, Vol. 2. Morgan Kaufmann, San Mateo, California.
Dyer, M. (1983). In-Depth Understanding. MIT Press, Cambridge, Massachusetts.
Dzeroski, S., Muggleton, S. H., and Russell, S. J. (1992). PAC-learnability of determinate logic programs. In
Proceedings of the Fifth Annual ACM Workshop on Computational Learning Theory (COLT-92), pp. 128135,
Pittsburgh, Pennsylvania. ACM Press.
Earley, J. (1970). An efficient context-free parsing algorithm. Communications of the Association for
Computing Machinery, 13(2), 94102.
Ebeling, C. (1987). All the Right Moves. MIT Press, Cambridge, Massachusetts.
Eco, U. (1979). Theory of Semiotics. Indiana University Press, Bloomington, Indiana.
Edmonds, J. (1965). Paths, trees, and flowers. Canadian Journal of Mathematics, 17, 449467.
Edwards, P. (Ed.). (1967). The Encyclopedia of Philosophy. Macmillan, London.
Eiter, T., Leone, N., Mateis, C., Pfeifer, G., and Scarcello, F. (1998). The KR system dlv: Progress report,
comparisons and benchmarks. In Cohn, A., Schubert, L., and Shapiro, S. (Eds.), Proceedings of the Sixth
International Conference on Principles of Knowledge Representation and Reasoning, pp. 406417, Trento,
Italy.
884
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Elhadad, M. (1993). FUF: The universal unifieruser manual. Technical report, Ben Gurion University of the
Negev, Beer Sheva, Israel.
Elkan, C. (1993). The paradoxical success of fuzzy logic. In Proceedings of the Eleventh National Conference
on Artificial Intelligence (AAAI-93), pp. 698703, Washington, DC. AAAI Press.
Elkan, C. (1997). Boosting and naive Bayesian learning. Tech. rep., Department of Computer Science and
Engineering, University of California, San Diego.
Elman, J., Bates, E., Johnson, M., Karmiloff-Smith, A., Parisi, D., and Plunkett, K. (1997). Rethinking
Innateness. MIT Press, Cambridge, Massachusetts.
Empson, W. (1953). Seven Types of Ambiguity. New Directions, New York.
Enderton, H. B. (1972). A Mathematical Introduction to Logic. Academic Press, New York.
Erdmann, M. A. and Mason, M. (1988). An exploration of sensorless manipulation. IEEE Journal of Robotics
and Automation, 4(4), 369379.
Erman, L. D., Hayes-Roth, F., Lesser, V. R., and Reddy, R. (1980). The hearsay-ii speech-understanding
system: Integrating knowledge to resolve uncertainty. Computing Surveys, 12(2), 213253.
Ernst, H. A. (1961). MH-1, a Computer-Operated Mechanical Hand. Ph.D. thesis, Massachusetts Institute of
Technology, Cambridge, Massachusetts.
Ernst, M., Millstein, T., and Weld, D. S. (1997). Automatic SAT-compilation of planning problems. In
Proceedings of the Fifteenth International Joint Conference on Artificial Intelligence (IJCAI-97), pp. 1169
1176, Nagoya, Japan. Morgan Kaufmann.
Erol, K., Hendler, J., and Nau, D. S. (1994). HTN planning: Complexity and expressivity. In Proceedings of the
Twelfth National Conference on Artificial Intelligence (AAAI-94), pp. 11231128, Seattle. AAAI Press.
Erol, K., Hendler, J., and Nau, D. S. (1996). Complexity results for HTN planning. Annals of Mathematics and
Artificial Intelligence, 18(1), 6993.
Etzioni, O. (1989). Tractable decision-analytic control. In Proc. of 1st International Conference on Knowledge
Representation and Reasoning, pp. 114125, Toronto.
Etzioni, O., Hanks, S., Weld, D. S., Draper, D., Lesh, N., and Williamson, M. (1992). An approach to planning
with incomplete information. In Proceedings of the 3rd International Conference on Principles of Knowledge
Representation and Reasoning, Cambridge, Massachusetts.
Etzioni, O. and Weld, D. S. (1994). A softbot-based interface to the Internet. Communications of the
Association for Computing Machinery, 37(7), 7276.
Evans, T. G. (1968). A program for the solution of a class of geometric-analogy intelligence-test questions. In
Minsky, M. L. (Ed.), Semantic Information Processing, pp. 271353. MIT Press, Cambridge, Massachusetts.
Fagin, R., Halpern, J. Y., Moses, Y., and Vardi, M. Y. (1995). Reasoning about Knowledge. MIT Press,
Cambridge, Massachusetts.
Fahlman, S. E. (1974). A planning system for robot construction tasks. Artificial Intelligence, 5(1), 149.
Fahlman, S. E. (1979). NETL: A System for Representing and Using Real-World Knowledge. MIT Press,
Cambridge, Massachusetts.
Faugeras, O. (1992). What can be seen in three dimensions with an uncalibrated stereo rig?. In Sandini, G.
(Ed.), Preceedings of the European Conference on Computer Vision, Vol. 588 of Lecture Notes in Computer
Science, pp. 563578. Springer-Verlag.
Faugeras, O. (1993). Three-Dimensional Computer Vision: A Geometric Viewpoint. MIT Press, Cambridge,
Massachusetts.
885
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Faugeras, O., Luong, Q.-T., and Papadopoulo, T. (2001). The Geometry of Multiple Images. MIT Press,
Cambridge, Massachusetts.
Fearing, R. S. and Hollerbach, J. M. (1985). Basic solid mechanics for tactile sensing. International Journal of
Robotics Research, 4(3), 4054.
Featherstone, R. (1987). Robot Dynamics Algorithms. Kluwer Academic Publishers, Boston, MA.
Feigenbaum, E. A. (1961). The simulation of verbal learning behavior. Proceedings of the Western Joint
Computer Conference, 19, 121131.
Feigenbaum, E. A., Buchanan, B. G., and Lederberg, J. (1971). On generality and problem solving: A case
study using the DENDRAL program. In Meltzer, B. and Michie, D. (Eds.), Machine Intelligence 6, pp. 165
190. Edinburgh University Press, Edinburgh, Scotland.
Feigenbaum, E. A. and Feldman, J. (Eds.). (1963). Computers and Thought. McGraw-Hill, New York.
Feldman, J. and Sproull, R. F. (1977). Decision theory and artificial intelligence II: The hungry monkey.
Technical report, Computer Science Department, University of Rochester.
Feldman, J. and Yakimovsky, Y. (1974). Decision theory and artificial intelligence I: Semantics-based region
analyzer. Artificial Intelligence, 5(4) 349371.
Fellbaum, C. (2001). Wordnet: An Electronic Lexical Database. MIT Press, Cambridge, Massachusetts.
Feller, W. (1971). An Introduction to Probability Theory and its Applications, Vol. 2. John Wiley.
Ferraris, P. and Giunchiglia, E. (2000). Planning as satisability in nondeterministic domains. In Proceedings of
Seventeenth National Conference on Artificial Intelligence, pp. 748753. AAAI Press.
Fikes, R. E., Hart, P. E., and Nilsson, N. J. (1972). Learning and executing generalized robot plans. Artificial
Intelligence, 3(4), 251288.
Fikes, R. E. and Nilsson, N. J. (1971). STRIPS: A new approach to the application of theorem proving to
problem solving. Artificial Intelligence, 2(34), 189208.
Fikes, R. E. and Nilsson, N. J. (1993). STRIPS, a retrospective. Artificial Intelligence, 59(12), 227232.
Findlay, J. N. (1941). Time: A treatment of some puzzles. Australasian Journal of Psychology and Philosophy,
19(3), 216235.
Finney, D. J. (1947). Probit analysis: A statistical treatment of the sigmoid response curve. Cambridge
University Press, Cambridge, UK.
Firby, J. (1994). Task networks for controlling continuous processes. In Hammond, K. (Ed.), Proceedings of
the Second International Conference on AI Planning Systems, pp. 4954, Menlo Park, CA. AAAI Press.
Firby, R. J. (1996). Modularity issues is reactive planning. In Proceedings of the 3rd International Conference
on Artificial Intelligence Planning Systems (AIPS-96), pp. 7885, Edinburgh, Scotland. AAAI Press.
Fischer, M. J. and Ladner, R. E. (1977). Propositional modal logic of programs. In Proceedings of the 9th ACM
Symposium on the Theory of Computing, pp. 286294, New York. ACM Press.
Fisher, R. A. (1922). On the mathematical foundations of theoretical statistics. Philosophical Transactions of
the Royal Society of London, Series A 222, 309368.
Fix, E. and Hodges, J. L. (1951). Discriminatory analysisnonparametric discrimination: Consistency
properties. Tech. rep. 21-49-004, USAF School of Aviation Medicine, Randolph Field, Texas.
Fogel, D. B. (2000). Evolutionary Computation: Toward a New Philosophy of Machine Intelligence. IEEE
Press, Piscataway, New Jersey.
886
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Fogel, L. J., Owens, A. J., and Walsh, M. J. (1966). Artificial Intelligence through Simulated Evolution. Wiley,
New York.
Forbes, J. (2002). Learning Optimal Control for Autonomous Vehicles. Ph.D. thesis, University of California,
Berkeley.
Forbus, K. D. (1985). The role of qualitative dynamics in naive physics. In Hobbs, J. R. and Moore, R. C.
(Eds.), Formal Theories of the Commonsense World, chap. 5, pp. 185226. Ablex Norwood, New Jersey.
Forbus, K. D. and de Kleer, J. (1993). Building Problem Solvers. MIT Press, Cambridge, Massachusetts.
Ford, K. M. and Hayes, P. J. (1995). Turing Test considered harmful. In Proceedings of the Fourteenth
International Joint Conference on Artificial Intelligence (IJCAI-95), pp. 972977, Montreal. Morgan
Kaufmann.
Forestier, J.-P. and Varaiya, P. (1978). Multilayer control of large Markov chains. IEEE Transactions on
Automatic Control, 23(2), 298304.
Forgy, C. (1981). OPS5 users manual. Technical report CMU-CS-81-135, Computer Science Department,
Carnegie-Mellon University, Pittsburgh.
Forgy, C. (1982). A fast algorithm for the many patterns/many objects match problem. Artificial Intelligence,
19(1), 1737.
Forsyth, D. and Zisserman, A. (1991). Reflections on shading. IEEE Transactions on Pattern Analysis and
Machine Intelligence (PAMI), 13(7), 671679.
Fortescue, M. D. (1984). West Greenlandic. Croom Helm, London.
Foster, D. W. (1989). Elegy by W. W.: A Study in Attribution. Associated University Presses, Cranbury, New
Jersey.
Fourier, J. (1827). Analyse des travaux de lAcadmie Royale des Sciences, pendant lanne 1824; partie
mathmatique. Histoire de lAcadmie Royale des Sciences de France, 7, xlviilv.
Fox, D., Burgard, W., Dellaert, F., and Thrun, S. (1999). Monte Carlo localization: Efficient position estimation
for mobile robots. In Proceedings of the National Conference on Artificial Intelligence (AAAI), Orlando, FL.
AAAI.
Fox, M. S. (1990). Constraint-guided scheduling: A short history of research at CMU. Computers in Industry,
14(13), 7988.
Fox, M. S., Allen, B., and Strohm, G. (1982). Job shop scheduling: An investigation in constraint-directed
reasoning. In Proceedings of the National Conference on Artificial Intelligence (AAAI-82), pp. 155158,
Pittsburgh, Pennsylvania. Morgan Kaufmann.
Fox, M. S. and Long, D. (1998). The automatic inference of state invariants in TIM. Journal of Artificial
Intelligence Research, 9, 367421.
Frakes, W. and Baeza-Yates, R. (Eds.). (1992). Information Retrieval: Data Structures and Algorithms.
Prentice-Hall, Upper Saddle River, New Jersey.
Francis, S. and Kucera, H. (1967). Computing Analysis of Present-day American English. Brown University
Press, Providence, Rhode Island.
Franco, J. and Paull, M. (1983). Probabilistic analysis of the Davis Putnam procedure for solving the
satisfiability problem. Discrete Applied Mathematics, 5, 7787.
Frank, R. H. and Cook, P. J. (1996). The Winner-Take-All Society. Penguin, New York.
Frege, G. (1879). Begriffsschrift, eine der arithmetischen nachgebildete Formelsprache des reinen Denkens.
Halle, Berlin. English translation appears in van Heijenoort (1967).
887
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Freuder, E. C. (1978). Synthesizing constraint expressions. Communications of the Association for Computing
Machinery, 21(11), 958966.
Freuder, E. C. (1982). A sufficient condition for backtrack-free search. Journal of the Association for
Computing Machinery, 29(1), 2432.
Freuder, E. C. (1985). A sufficient condition for backtrack-bounded search. Journal of the Association for
Computing Machinery, 32(4), 755761.
Freuder, E. C. and Mackworth, A. K. (Eds.). (1994). Constraint-based reasoning. MIT Press, Cambridge,
Massachusetts.
Freund, Y. and Schapire, R. E. (1996). Experiments with a new boosting algorithm. In Proceedings of the
Thirteenth International Conference on Machine Learning, Bari, Italy. Morgan Kaufmann.
Friedberg, R. M. (1958). A learning machine: Part I. IBM Journal, 2, 213.
Friedberg, R. M., Dunham, B., and North, T. (1959). A learning machine: Part II. IBM Journal of Research and
Development, 3(3), 282287.
Friedman, G. J. (1959). Digital simulation of an evolutionary process. General Systems Yearbook, 4, 171184.
Friedman, J., Hastie, T., and Tibshirani, R. (2000). Additive logistic regression: A statistical view of boosting.
Annals of Statistics, 28(2), 337374.
Friedman, N. (1998). The Bayesian structural EM algorithm. In Uncertainty in Artificial Intelligence:
Proceedings of the Fourteenth Conference, Madison, Wisconsin. Morgan Kaufmann.
Friedman, N. and Goldszmidt, M. (1996). Learning Bayesian networks with local structure. In Uncertainty in
Artificial Intelligence: Proceedings of the Twelfth Conference, pp. 252262, Portland, Oregon. Morgan
Kaufmann.
Fry, D. B. (1959). Theoretical aspects of mechanical speech recognition. Journal of the British Institution of
Radio Engineers, 19(4), 211218.
Fuchs, J. J., Gasquet, A., Olalainty, B., and Currie, K. W. (1990). PlanERS-1: An expert planning system for
generating spacecraft mission plans. In First International Conference on Expert Planning Systems, pp. 7075,
Brighton, UK. Institute of Electrical Engineers.
Fudenberg, D. and Tirole, J. (1991). Game theory. MIT Press, Cambridge, Massachusetts.
Fukunaga, A. S., Rabideau, G., Chien, S., and Yan, D. (1997). ASPEN: A framework for automated planning
and scheduling of spacecraft control and operations. In Proceedings of the International Symposium on AI,
Robotics and Automation in Space, pp. 181187, Tokyo.
Fung, R. and Chang, K. C. (1989). Weighting and integrating evidence for stochastic simulation in Bayesian
networks. In Proceedings of the Fifth Conference on Uncertainty in Artificial Intelligence (UAI-89), pp. 209
220, Windsor, Ontario. Morgan Kaufmann.
Gaifman, H. (1964). Concerning measures in first order calculi. Israel Journal of Mathematics, 2, 118.
Gallaire, H. and Minker, J. (Eds.). (1978). Logic and Databases. Plenum, New York.
Gallier, J. H. (1986. Logic for Computer Science: Foundations of Automatic Theorem Proving. Harper and
Row, New York.
Gallo, G. and Pallottino, S. (1988). Shortest path algorithms. Annals of Operations Research, 13, 379.
Gamba, A., Gamberini, L., Palmieri, G., and Sanna, R. (1961). Further Experiments with PAPA. Nuovo
Cimento Supplemento, 20(2), 221231.
Garding, J. (1992). Shape from texture for smooth curved surfaces in perspecitve projection. Journal of
Mathematical Imaging and Vision, 2(4), 327350.
888
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Gardner, M. (1968). Logic Machines, Diagrams and Boolean Algebra. Dover, New York.
Garey, M. R. and Johnson, D. S. (1979). Computers and Intractability. W. H. Freeman, New York.
Gaschnig, J. (1977). A general backtrack algorithm that eliminates most redundant tests. In Proceedings of the
Fifth International Joint Conference on Artificial Intelligence (IJCAI-77), p. 457, Cambridge, Massachusetts.
IJCAII.
Gaschnig, J. (1979.) Performance measurement and analysis of certain search algorithms. Technical report
CMU-CS-79-124, Computer Science Department, Carnegie-Mellon University.
Gasser, R., (1995). Efficiently harnessing computational resources for exhaustive search. Ph.D. thesis, ETH
Zrich, Switzerland.
Gasser, R. (1998). Solving nine mens morris. In Nowakowski, r. (Ed.), Games of No Chance. Cambridge
University Press, Cambridge, UK.
Gat, E. (1998). Three-layered architectures. In Kortenkamp, D., Bonasso, R. P., and Murphy, R. (Eds.), AIbased Mobile Robots: Case Studies of Successful Robot Systems, pp. 195210. MIT Press.
Gauss, K. F. (1809). Theoria Motus Corporum Coelestium in Sectionibus Conicis Solem Ambientium. Sumtibus
F. Perthes et I. H. Besser, Hamburg.
Gauss, K. F. (1829). Beitrge zur theorie der algebraischen gleichungen. Collected in Werke, Vol. 3, pages 71
102. K. Gesellschaft Wissenschaft, Gttingen, Germany, 1876.
Gawande, A. (2002). Complications: A Surgeons Notes on an Imperfect Science. Metropolitan Books, New
York.
Ge, N., Hale, J. and Charniak, E. (1998). A statistical approach to anaphora resolution. In Proceedings of the
Sixth Workshop on Very Large Corpora, pp. 161171, Montreal. COLING-ACL.
Geiger, D., Verma, T., and Pearl, J. (1990). Identifying independence in Bayesian networks. Networks, 20(5),
507534.
Gelb, A. (1974). Applied Optimal Estimation. MIT Press, Cambridge, Massachusetts.
Gelernter, H. (1959). Realization of a geometry-theorem proving machine. In Proceedings of an International
Conference on Information Processing, pp. 273282, Paris. UNESCO House.
Gelfond, M. and Lifschitz, v. (1988). Compiling circumscriptive theories into logic programs. In Reinfrank, M.,
de Kleer, J., Ginsberg, M. L., and Sandewall, E. (Eds.), Non-Monotonic Reasoning: 2nd International Workshop
Proceedings, pp. 7499, Grassau, Germany. Springer-Verlag.
Gelman, A., Carlin, J. B., Stern, H. S., and Rubin, D. (1995). Bayesian Data Analysis. Chapman & Hall,
London.
Geman, S. and Geman, D. (1984). Stochastic relaxation, Gibbs distributions, and Bayesian restoration of
images. IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI), 6(6), 721741.
Genesereth, M. R. (1984). The use of design descriptions in automated diagnosis. Artificial Intelligence, 24(1
3), 411436.
Genesereth, M. R. and Nilsson, N. J. (1987). Logical Foundations of Artificial Intelligence. Morgan Kaufmann,
San Mateo, California.
Genesereth, M. R. and Nourbakhsh, I. (1993). Time-saving tips for problem solving with incomplete
information. In Proceedings of the Eleventh National Conference on Artificial Intelligence (AAAI-93), pp. 724
730, Washington, DC. AAAI Press.
Genesereth, M. R. and Smith, D. E. (1981). Metalevel architecture. Memo HPP-81-6, Computer Science
Department, Stanford University, Stanford, California.
889
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Gentner, D. (1983). Structure mapping: A theoretical framework for analogy. Cognitive Science, 7, 155170.
Gentzen, G. (1934). Untersuchungen ber das logische Schliessen. Mathematische Zeitschrift, 39, 176210,
405431.
Georgeff, M. P. and Lansky, A. L. (1987). Reactive reasoning and planning. In Proceedings of the Sixth
National Conference on Artificial Intelligence (AAAI-87), pp. 677682, Seattle. Morgan Kaufmann.
Gerevini, A. and Schubert, L. K. (1996). Accelerating partial-order planners: Some techniques for effective
search control and pruning. Journal of Artificial Intelligence Research, 5, 95137.
Gerevini, A. and Serina, I. (2002). LPG: A planner based on planning graphs with action costs. In Proceedings
of the Sixth International Conference on AI Planning and Scheduling, pp. 281290, Menlo Park, California.
AAAI Press.
Germann, U., Jahr, M., Knight, K., Marcu, D., and Yamada, K. (2001). Fast decoding and optimal decoding for
machine translation. In Proceedings of the Conference of the Association for Computational Linguistics (ACL),
pp. 228235, Toulouse, France.
Gershwin, G. (1937). Lets call the whole thing off. song.
Ghahramani, Z. and Jordan, M. I. (1997). Factorial hidden Markov models. Machine Learning, 29, 245274.
Ghallab, M., Howe, A., Knoblock, C. A., and McDermott, D. (1998). PDDLthe planning dormain definition
language. Tech. rep. DCS TR-1165, Yale Center for Computational Vision and Control, New Haven,
Connecticut.
Ghallab, M. and Laruelle, H. (1994). Representation and control in IxTeT, a temporal planner. In Proceedings
of the 2nd International Conference on Artificial Intelligence Planning Systems (AIPS-94), pp. 6167, Chicago.
AAAI Press.
Giacomo, G. D., Lesprance, Y., and Levesque, H. J. (2000). ConGolog, a concurrent programming language
based on the situation calculus. Artificial Intelligence, 121, 109169.
Gibson, J. J. (1950). The Perception of the Visual World. Houghton Mifflin, Boston.
Gibson, J. J. (1979). The Ecological Approach to Visual Perception. Houghton Mifflin, Boston.
Gibson, J. J., Olum, P., and Rosenblatt, F. (1955). Parallax and perspective during aircraft landings. American
Journal of Psychology, 68, 372385.
Gilks, W. R., Richardson, S., and Spiegelhalter, D. J. (Eds.). (1996). Markov chain Monte Carlo in practice.
Chapman and Hall, London.
Gilks, W. R., Thomas, A., and Spiegelhalter, D. J. (1994). A language and program for complex Bayesian
modelling. The Statistician, 43, 169178.
Gilmore, P. C. (1960). A proof method for quantification theory: Its justification and realization. IBM Journal
of Research and Development, 4, 2835.
Ginsberg, M. L. (1989). Universal planning: An (almost) universally bad idea. AI Magazine, 10(4), 4044.
Ginsberg, M. L. (1993). Essentials of Artificial Intelligence. Morgan Kaufmann, San Mateo, California.
Ginsberg, M. L. (1999). GIB: Steps toward an expert-level bridge-playing program. In Proceedings of the
Sixteenth International Joint Conference on Artificial Intelligence (IJCAI-99), pp. 584589, Stockholm. Morgan
Kaufmann.
Ginsberg, M. L., Frank, M., Halpin, M. P., and Torrance, M. C. (1990). Search lessons learned from crossword
puzzles. In Proceedings of the Eighth National Conference on Artificial Intelligence (AAAI-90), Vol. 1, pp. 210
215, Boston. MIT Press.
Gittins, J. C. (1989). Multi-Armed Bandit Allocation Indices. Wiley, New York.
890
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Glanc, A. (1978). On the etymology of the word robot. SIGART Newsletter, 67, 12.
Glover, F. (1989). Tabu search: 1. ORSA Journal on Computing, 1(3), 190206.
Glover, F. and Laguna, M. (Eds.). (1997). Tabu search. Kluwer, Dordrecht, Netherlands.
Gdel, K. (1930). ber die Vollstndigkeit des Logikkalkls, Ph.D. thesis, University of Vienna.
Gdel, K. (1931). ber formal unentscheidbare Stze der Principia mathematica und verwandter Systeme I.
Monatshefte fr Mathematik und Physik, 38, 173198.
Goebel, J., Volk, K., Walker, H., and Gerbault, F. (1989). Automatic classification of spectra from the infrared
astronomical satellite (IRAS). Astronomy and Astrophysics, 222, L5L8.
Gold, B. and Morgan, N. (2000). Speech and Audio Signal Processing. Wiley, New York.
Gold, E. M. (1967). Language identification in the limit. Information and Control, 10, 447474.
Golden, K. (1998). Leap before you look: Information gathering in the PUCCINI planner. In Proceedings of the
4th International Conference on Artificial Intelligence Planning Systems (AIPS-98), pp. 7077, Pittsburgh,
Pennsylvania. AAAI Press.
Goldman, N. (1975). Conceptual generation. In Schank, R. (Ed.), Conceptual Information Processing, chap. 6.
North-Holland, Amsterdam.
Goldman, R. and Boddy, M. (1996). Expressive planning and explicit knowledge. In Proceedings of the 3rd
International Conference on Artificial Intelligence Planning Systems (AIPS-96), pp. 110117, Edinburgh,
Scotland. AAAI Press.
Gomes, C., Selman, B., and Kautz, H. (1998). Boosting combinatorial search through randomization. In
Proceedings of the Fifteenth National Conference on Artificial Intelligence (AAAI-98), pp. 431437, Madison,
Wisconsin. AAAI Press.
Good, I. J. (1950). Contribution to the discussion of Eliot Slaters Statistics for the chess computer and the
factor of mobility. In Symposium on Information Theory, p. 199, London. Ministry of Supply.
Good, I. J. (1961). A causal calculus. British Journal of the Philosophy of Science, 11, 305318.
Good, I. J. (1965). Speculations concerning the first ultraintelligent machine. In Alt, F. L. and Rubinoff, M.
(Eds.), Advances in Computers, Vol. 6, pp. 3188. Academic Press, New York.
Goodman, D. and Keene, R. (1997). Man versus Machine: Kasparov versus Deep Blue. H3 Publications,
Cambridge, Massachusetts.
Goodman, N. (1954). Fact, Fiction and Forecast. University of London Press, London.
Goodman, N. (1977). The Structure of Appearance (3rd edition). D. Reidel, Dordrecht, Netherlands.
Gordon, M. J., Milner, A. J., and Wadsworth, C. P. (1979). Edinburgh LCF. Springer-Verlag, Berlin.
Gordon, N. J. (1994). Bayesian methods for tracking. Ph.D. thesis, Imperial College, University of London.
Gordon, N. J., Salmond, D. J., and Smith, A. F. M. (1993). Novel approach to nonlinear/non-Gaussian
Bayesian state estimation. IEE Proceedings F (Radar and Signal Processing), 140(2), 107113.
Gorry, G. A. (1968). Strategies for computer-aided diagnosis. Mathematical Biosciences, 2(34, 293318.
Gorry, G. A., Kassirer, J. P., Essig, A., and Schwartz, W. B. (1973). Decision analysis as the basis for
computer-aided management of acute renal failure. American Journal of Medicine, 55, 473484.
Gottlob, G., Leone, N., and Scarcello, F. (1999a). A comparison of structural CSP decomposition methods. In
Proceedings of the Sixteenth International Joint Conference on Artificial Intelligence (IJCAI-99), pp. 394399,
Stockholm. Morgan Kaufmann.
891
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Gottlob, G., Leone, N., and Scarcello, F. (1999b). Hypertree decompositions and tractable queries. In
Proceedings of the 18th ACM International Symposium on Principles of Database Systems, pp. 2132,
Philadelphia. Association for Computing Machinery.
Graham, S. L., Harrison, M. A., and Ruzzo, W. L. (1980). An improved context-free recognizer. ACM
Transactions on Programming Languages and Systems, 2(3), 415462.
Grassmann, H. (1861). Lehrbuch der Arithmetik. Th. Chr. Fr. Enslin, Berlin.
Grayson, C. J. (1960). Decisions under uncertainty: Drilling decisions by oil and gas operators. Tech. rep.,
Division of Research, Harvard Business School, Boston.
Green, B., Wolf, A., Chomsky, C., and Laugherty, K. (1961). BASEBALL: An automatic question answerer. In
Proceedings of the Western Joint Computer Conference, pp. 219224.
Green, C. (1969a). Application of theorem proving to problem solving. In Proceedings of the First
International Joint Conference on Artificial Intelligence (ijcai-69), pp. 219239, Washington, DC. IJCAII.
Green, C. (1969b). Theorem-proving by resolution as a basis for question-answering systems. In Meltzer, B.,
Michie, D., and Swann, M. (Eds.), Machine Intelligence 4, pp. 183205. Edinburgh University Press,
Edinburgh, Scotland.
Green, C. and Raphael, B. (1968). The use of theorem-proving techniques in question-answering systems. In
Proceedings of the 23rd ACM National Conference, Washington, DC. ACM Press.
Greenblatt, R. D., Eastlake, D. E., and Crocker, S. D. (1967). The Greenblatt chess program. In Proceedings of
the Fall Joint Computer Conference, pp. 801810. American Federation of Information Processing Societies
(AFIPS).
Greiner, R. (1989). Towards a formal analysis of EBL. In Proceedings of the Sixth International Machine
Learning Workshop, pp. 450453, Ithaca, NY. Morgan Kaufmann.
Grice, H. P. (1957). Meaning. Philosophical Review, 66, 377388.
Grosz, B. J., Joshi, A. K., and Weinstein, S. (1995). Centering: A framework for modeling the local coherence
of discourse. Computational Linguistics, 21(2), 203225.
Grosz, B. J. and Sidner, C. L. (1986). Attention, intentions, and the structure of discourse. Computational
Linguistics, 12(3), 175204.
Grosz, B. J., Sparck Jones, K., and Webber, B. L. (Eds.). (1986). Readings in Natural Language Processing.
Morgan Kaufmann, San Mateo, California.
Grove, W. and Meehl, P. (1996). Comparative efficiency of informal (subjective, impressionistic) and formal
(mechanical, algorithmic) prediction procedures: The clinical statistical controversy. Psychology, Public Policy,
and Law, 2, 293323.
Gu, J. (1989). Parallel Algorithms and Architectures for Very Fast AI Search. Ph.D. thesis, University of Utah.
Guard, J., Oglesby, F., Bennett, J., and Settle, L. (1969). Semi-automated mathematics. Journal of the
Association for Computing Machinery, 16, 4962.
Guibas, L. J., Knuth, D. E., and Sharir, M. (1992). Randomized incremental construction of Delaunay and
Voronoi diagrams. Algorithmica, 7, 381413. See also 17th Int. Coll. on Automata, Languages and
Programming, 1990, pp. 414431.
Haas, A. (1986). A syntactic theory of belief and action. Artificial Intelligence, 28(3), 245292.
Hacking, I. (1975). The Emergence of Probability. Cambridge University Press, Cambridge, UK.
Hald, A. (1990). A History of Probability and Statistics and Their Applications before 1750. Wiley, New York.
Halpern, J. Y. (1990). An analysis of first-order logics of probability. Artificial Intelligence, 46(3), 311350.
892
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Hamming, R. W. (1991). The Art of Probability for Scientists and Engineers. Addison-Wesley, Reading,
Massachusetts.
Hammond, K. (1989). Case-Based Planning: Viewing Planning as a Memory Task. Academic Press, New
York.
Hamscher, W., Console, L., and Kleer, J. D. (1992). Readings in Model-based Diagnosis. Morgan Kaufmann,
San Mateo, California.
Handschin, J. E. and Mayne, D. Q. (1969). Monte Carlo techniques to estimate the conditional expectation in
multi-stage nonlinear filtering. International Journal of Control, 9(5), 547559.
Hansen, E. (1998). Solving POMDPs by searching in policy space. In Uncertainty in Artificial Intelligence:
Proceedings of the Fourteenth Conference, pp. 211219, Madison, Wisconsin. Morgan Kaufmann.
Hansen, E. and Zilberstein, S. (2001). LAO*: a heuristic search algorithm that finds solutions with loops.
Artificial Intelligence, 129(12), 3562.
Hansen, P. and Jaumard, B. (1990). Algorithms for the maximum satisfiability problem. Computing, 44(4),
279303.
Hanski, I. and Cambefort, Y. (Eds.). (1991). Dung Beetle Ecology. Princeton University Press, Princeton, New
Jersey.
Hansson, O. and Mayer, A. (1989). Heuristic search as evidential reasoning. In Proceedings of the Fifth
Workshop on Uncertainty in Artificial Intelligence, Windsor, Ontario. Morgan Kaufmann.
Hansson, O., Mayer, A., and Yung, M. (1992). Criticizing solutions to relaxed models yields powerful
admissible heuristics. Information Sciences, 63(3), 207227.
Haralick, R. M. and Elliot, G. L. (1980). Increasing tree search efficiency for constraint satisfaction problems.
Artificial Intelligence, 14(3), 263313.
Hardin, G. (1968). The tragedy of the commons. Science, 162, 12431248.
Harel, D. (1984). Dynamic logic. In Gabbay, D. and Guenthner, F. (Eds.), Handbook of Philosophical Logic,
Vol. 2, pp. 497604. D. Reidel, Dordrecht, Netherlands.
Harman, G. H. (1983). Change in View: Principles of Reasoning. MIT Press, Cambridge, Massachusetts.
Harsanyi, J. (1967). Games with incomplete information played by Bayesian players. Management Science, 14,
159182.
Hart, P. E., Nilsson, N. J. and Raphael, B. (1968). A formal basis for the heuristic determination of minimum
cost paths. IEEE Transactions on Systems Science and Cybernetics, SSC-4(2), 100107.
Hart, P. E., Nilsson, N. J., and Raphael, B. (1972). Correction to A formal basis for the heuristic determination
of minimum cost paths. SIGART Newsletter, 37, 2829.
Hart, T. P. and Edwards, D. J. (1961). The tree prune (TP) algorithm. Artificial intelligence project memo 30,
Massachusetts Institute of Technology, Cambridge, Massachusetts.
Hartley, R. and Zisserman, A. (2000). Multiple view geometry in computer vision. Cambridge University Press,
Cambridge, UK.
Haslum, P. and Geffner, H. (2001). Heuristic planning with time and resources. In Proceedings of the IJCAI-01
Workshop on Planning with Resources, Seattle.
Hastie, T. and Tibshirani, R. (1996). Discriminant adaptive nearest neighbor classification and regression. In
Touretzky, D. S., Mozer, M. C., and Hasselmo, M. E. (Eds.), Advances in Neural Information Processing
Systems, Vol. 8, pp. 40915. MIT Press, Cambridge, Massachusetts.
893
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Hastie, T., Tibshirani, R. and Friedman, J. (2001). The Elements of Statistical Learning: Data Mining, Inference
and Prediction. Springer-Verlag, Berlin.
Haugeland, J. (Ed.). (1981). Mind Design. MIT Press, Cambridge, Massachusetts.
Haugeland, J. (Ed.). (1985). Artificial Intelligence: The Very Idea. MIT Press, Cambridge, Massachusetts.
Haussler, D. (1989). Learning conjunctive concepts in structural domains. Machine Learning, 4(1), 740.
Havelund, K., Lowry, M., Park, S., Pecheur, C., Penix, J., Visser, W., and White, J. L. (2000). Formal analysis
of the remote agent before and after flight. In Proceedings of the 5th NASA Langley Formal Methods Workshop,
Williamsburg, VA.
Hayes, P. J. (1978). The naive physics manifesto. In Michie, D. (Ed.), Expert Systems in the Microelectronic
Age. Edinburgh University Press, Edinburgh, Scotland.
Hayes, P. J. (1979). The logic of frames. In Metzing, D. (Ed.), Frame Conceptions and Text Understanding, pp.
4661. de Gruyter, Berlin.
Hayes, P. J. (1985a). Naive physics I: Ontology for liquids. In Hobbs, J. R. and Moore, R. C. (eds.), Formal
Theories of the Commonsense World, chap. 3, pp. 71107. Ablex, Norwood, New Jersey.
Hayes, P. J. (1985b). The second naive physics manifesto. In Hobbs, J. R. and Moore, R. C. (Eds.), Formal
Theories of the Commonsense World, chap. 1, pp. 136. Ablex, Norwood, New Jersey.
Hebb, D. O. (1949). The Organization of Behavior. Wiley, New York.
Heckerman, D. (1986). Probabilistic interpretation for MYCINs certainty factors. In Kanal, L. N. and
Lemmer, J. F. (Eds.), Uncertainty in Artificial Intelligence, pp. 167196. Elsevier/North-Holland, Amsterdam,
London, New York.
Heckerman, D. (1991). Probabilistic Similarity Networks. MIT Press, Cambridge, Massachusetts.
Heckerman, D. (1998). A tutorial on learning with Bayesian networks. In Jordan, M. I. (Ed.), Learning in
graphical models. Kluwer, Dordrecht, Netherlands.
Heckerman, D., Geiger, D., and Chickering, D. M. (1994). Learning Bayesian networks: The combination of
knowledge and statistical data. Technical report MSR-TR-94-09, Microsoft Research, Redmond, Washington.
Heim, I. and Kratzer, A. (1998). Semantics in a Generative Grammar. Blackwell, Oxford, UK.
Heinz, E. A. (2000). Scalable search in computer chess. Vieweg, Braunschweig, Germany.
Held, M. and Karp, R. M. (1970). The traveling salesman problem and minimum spanning trees. Operations
Research, 18, 11381162.
Helmert, M. (2001). On the complexity of planning in transportation domains. In Cesta, A. and Barrajo, D.
(Eds.), Sixth European Conference on Planning (ECP-01), Toledo, Spain. Springer-Verlag.
Hendrix, G. G. (1975). Expanding the utility of semantic networks through partitioning. In Proceedings of the
Fourth International Joint Conference on Artificial Intelligence (IJCAI-75), pp. 115121, Tbilisi, Georgia.
IJCAII.
Henrion, M. (1988). Propagation of uncertainty in Bayesian networks by probabilistic logic sampling. In
Lemmer, J. F. and Kanal, L. N. (Eds.), Uncertainty in Artificial Intelligence 2, pp. 149163. Elsevier/NorthHolland, Amsterdam, London, New York.
Henzinger, T. A. and Sastry, S. (Eds.). (1998). Hybrid systems: Computation and control. Springer-Verlag,
Berlin.
Herbrand, J. (1930). Recherches sur la Thorie de la Dmonstration. Ph.D. thesis, University of Paris.
894
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Hewitt, C. (1969). PLANNER: a language for proving theorems in robots. In Proceedings of the First
International Joint Conference on Artificial Intelligence (IJCAI-69), pp. 295301, Washington, DC. IJCAII.
Hierholzer, C. (1873). ber die Mglichkeit, einen Linienzug ohne Wiederholung und ohne Unterbrechung zu
umfahren. Mathematische Annalen, 6, 3032.
Hilgard, E. R. and Bower, G. H. (1975). Theories of Learning (4th edition). Prentice-Hall, Upper Saddle River,
New Jersey.
Hintikka, J. (1962). Knowledge and Belierf. Cornell University Press, Ithaca, New York.
Hinton, G. E. and Anderson, J. A. (1981). Parallel Models of Associative Memory. Lawrence Erlbaum
Associates, Potomac, Maryland.
Hinton, G. E. and Nowlan, S. J. (1987). How learning can guide evolution. Complex Systems, 1(3), 495502.
Hinton, G. E. and Sejnowski, T. (1983). Optimal perceptual inference. In Proceedings of the IEEE Computer
Society Conference on Computer Vision and Pattern Recognition, pp. 448453, Washington, DC. IEEE
Computer Society Press.
Hinton, G. E. and Sejnowski, T. (1986). Learning and relearning in Boltzmann machines. In Rumelhart, D. E.
and McClelland, J. L. (Eds.), Parallel Distributed Processing, chap. 7, pp. 282317. MIT Press, Cambridge,
Massachusetts.
Hirsh, H. (1987). Explanation-based generalization in a logic programming environment. In Proceedings of the
Tenth International Joint Conference on Artificial Intelligence (IJCAI-87), Milan. Morgan Kaufmann.
Hirst, G. (1981). Anaphora in Natural Language Understanding: A Survey, Vol. 119 of Lecture Notes in
Computer Science. Springer-Verlag, Berlin.
Hirst, G. (1987). Semantic Interpretation against Ambiguity. Cambridge University Press, Cambridge, UK.
Hobbs, J. R. (1978). Resolving pronoun references. Lingua, 44, 339352.
Hobbs, J. R. (1990). Literature and Cognition. CSLI Press, Stanford, California.
Hobbs, J. R., Appelt, D., Bear, J., Israel, D., Kameyama, M., Stickel, M. E., and Tyson, M. (1997). FASTUS: A
cascaded finite-state transducer for extracting information from natural-language text. In Roche, E. and Schabes,
Y. (Eds.) Finite-State Devices for Natural Language Processing, pp. 383406. MIT Press, Cambridge,
Massachusetts.
Hobbs, J. R. and Moore, R. C. (Eds.). (1985). Formal Theories of the Commonsense World. Ablex, Norwood,
New Jersey.
Hobbs, J. R., Stickel, M. E., Appelt, D., and Martin, P. (1993). Interpretation as abduction. Artificial
Intelligence, 63(12), 69142.
Hoffmann, J. (2000). A heuristic for domain independent planning and its use in a n enforced hillclimbing
algorithm. In Proceedings of the 12th International Symposium on Methodologies for Intelligent Systems, pp.
216227, Charlotte, North Carolina. Springer-Verlag.
Hogan, N. (1985). Impedance control: An approach to manipulation. parts i, ii, and iii. Transactions ASME
Journal of Dynamics, Systems, Measurement, and Control, 107(3), 124.
Holland, J. H. (1975). Adaption in Natural and Artificial Systems. University of Michigan Press, Ann Arbor,
Michigan.
Holland, J. H. (1995). Hidden order: How adaptation builds complexity. Addison-Wesley, Reading,
Massachusetts.
Holldobler, S. and Schneeberger, J. (1990). A new deductive approach to planning. New Generation
Computing, 8(3), 225244.
895
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Holzmann, G. J. (1997). The Spin model checker. ISSS Transactions on Software Engineering, 23(5), 279295.
Hood, A. (1824). Case 4th28 July 1824 (Mr. Hoods cases of injuries of the brain). The Phrenological Journal
and Miscellany, 2, 8294.
Hopfield, J. J. (1982). Neurons with graded response have collective computational properties like those of twostate neurons. Proceedings of the National Academy of Sciences of the United States of America, 79, 2554
2558.
Horn, A. (1951). On sentences which are true of direct unions of algebras. Journal of Symbolic Logic, 16, 14
21.
Horn, B. K. P. (1970). Shape from shading: A method for obtaining the shape of a smooth opeque object from
one view. Technical report 232, MIT Artificial Intelligence Laboratory, Cambridge, Massachusetts.
Horn, B. K. P. (1986). Robot Vision. MIT Press, Cambridge, Massachusetts.
Horn, B. K. P. and Brooks, M. J. (1989). Shape from Shading. MIT Press, Cambridge, Massachusetts.
Horning, J. J. (1969). A study of grammatical inference. Ph.D. thesis, Stanford University.
Horowitz, E. and Sahni, s. (1978). Fundamentals of computer algorithms. Computer Science Press, Rockwille,
Maryland.
Horswill, I. (2000. Functional programming of behavior-based systems. Autonomous Robots, 9, 8393.
Horvitz, E. J. (1987). Problem-solving design: Reasoning about computational value, trade-offs, and resources.
In Proceedings of the Second Annual NASA Research Forum, pp. 2643, Moffett Field, California. NASA
Ames Research Center.
Horvitz, E. J. (1989). Rational metareasoning and compilation for optimizing decisions under bounded
resources. In Proceedings of Computational Intelligence 89, Milan. Association for Computing Machinery.
Horvitz, E. J. and Barry, M. (1995). Display of information for time-critical decision making. In Uncertainty in
Artificial Intelligence: Proceedings of the Eleventh Conference, pp. 296305, Montreal Canada. Morgan
Kaufmann.
Horvitz, E. J., Breese, J. S., Heckerman, D., and Hovel, D. (1998). The Lumiere project: Bayesian user
modeling for inferring the goals and needs of software users. In Uncertainty in Artificial Intelligence:
Proceedings of the Fourteenth Conference, pp. 256265, Madison, Wisconsin. Morgan Kaufmann.
Horvitz, E. J., Breese, J. S., and Henrion, M. (1988). Decision theory in expert systems and artificial
intelligence. International Journal of Approximate Reasoning, 2, 247302.
Horvitz, E. J. and Breese, J. S. (1996). Ideal partition of resources for metareasoning. In Proceedings of the
Thirteenth National Conference on Artificial Intelligence (AAAI-96), pp. 12291234, Portland, Oregon. AAAI
Press.
Horvitz, E. J. and Heckerman, D. (1986). The inconsistent use of measures of certainty in artificial intelligence
research. In Kanal, L. N. and Lemmer, J. F. (Eds.), Uncertainty in Artificial Intelligence, pp. 137151.
Elsevier/North-Holland, Amsterdam, London, New York.
Horvitz, E. J., Heckerman, D., and Langlotz, C. P. (1986). A framework for comparing alternative formalisms
for plausible reasoning. In Proceedings of the Fifth National Conference on Artificial Intelligence (AAAI-86),
Vol. 1, pp. 210214, Philadelphia. Morgan Kaufmann.
Hovy, E. (1988). Generating Natural Language under Progmatic Constraints. Lawrence Erlbaum, Potomac,
Maryland.
Howard, R. A. (1960). Dynamic Programming and Markov Processes. MIT Press, Cambridge, Massachusetts.
Howard, R. A. (1966). Information value theory. IEEE Transactions on Systems Science and Cybernetics, SSC2, 2226.
896
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Howard, R. A. (1977). Risk preference. In Howard, R. A. and Matheson, J. E. (Eds.), Readings in Decision
Analysis, pp. 429465. Decision Analysis Group, SRI International, Menlo Park, California.
Howard, R. A. (1989). Microrisks for medical decision analysis. International Journal of Technology
Assessment in Health Care, 5, 357370.
Howard, R. A. and Matheson, J. e. (1984). Influence diagrams. In Howard, R. A. and Matheson, J. E. (Eds.),
Readings on the Principles and Applications of Decision Analysis, pp. 721762. Strategic Decisions Group,
Menlo Park, California.
Hsu, F.-H. (1999). IBMs Deep Blue chess grandmaster chips. IEEE Micro, 19(2), 7080.
Hsu, F.-H., Anantharaman, T. S., Campbell, M. S., and Nowatzyk, A. (1990). A grandmaster chess machine.
Scientific American, 263(4), 4450.
Huang, T., Koller, D., Malik, J., Ogasawara, G., Rao, B., Russell, S. J., and Weber, J. (1994). Automatic
symbolic traffic scene analysis using belief networks. In Proceedings of the Twelfth National Conference on
Artificial Intelligence (AAAI-94), pp. 966972, Seattle. AAAI Press.
Huang, X. D., Acero, A., and Hon, H. (2001). Spoken Language Processing. Prentice Hall, Upper Saddle River,
New Jersey.
Hubel, D. H. (1988). Eye, Brain, and Vision. W. H. Freeman, New York.
Huddleston, R. D. and Pullum, G. K. (2002). The Cambridge Grammar of the English Language. Cambridge
University Press, Cambridge, UK.
Huffman, D. A. (1971). Impossible objects as nonsense sentences. In Meltzer, B. and Michie, D. (Eds.),
Machine Intelligence 6, pp. 295324. Edinburgh University Press, Edinburgh, Scotland.
Hughes, B. D. (1995). Random Walks and Random Environments, Vol. 1: Random Walks. Oxford University
Press, Oxford, UK.
Huhns, M. N. and Singh, M. P. (Eds.). (1998). Readings in agents. Morgan Kaufmann, San Mateo, California.
Hume, D. (1739). A Treatise of Human Nature (2nd edition). Republished by Oxford University Press, 1978,
Oxford, UK.
Hunsberger, L. and Grosz, B. J. (2000). A combinatorial auction for collaborative planning. In International
Conference on Multi-Agent Systems (ICMAS-2000).
Hunt, E. B., Marin, J., and Stone, P. T. (1966). Experiments in Induction. Academic Press, New York.
Hunter, L. and States, D. J. (1992). Bayesian classification of protein structure. IEEE Expert, 7(4), 6775.
Hurwicz, L. (1973). The design of mechanisms for resource allocation. American Economic Review Papers and
Proceedings, 63(1), 130.
Hutchins, W. J. and Somers, H. (1992). An Introduction to Machine Translation. Academic Press, New York.
Huttenlocher, D. P. and Ullman, S. (1990). Recognizing solid objects by alignment with an image.
International Journal of Computer Vision, 5(2), 195212.
Huygens, C. (1657). Ratiociniis in ludo aleae. In van Schooten, F. (Ed.), Exercitionum Mathematicorum.
Elsevirii, Amsterdam.
Hwa, R. (1998). An empirical evaluation of probabilistic lexicalized tree insertion grammars. In Proceedings of
COLING-ACL 98, pp. 557563, Montreal. International Committee on Computational Linguistics and
Association for Computational Linguistics.
Hwang, C. H. and Schubert, L. K. (1993). EL: A formal, yet natural, comprehensive knowledge representation.
In Proceedings of the Eleventh National Conference on Artificial Intelligence (AAAI-93), pp. 676-682,
Washington, DC. AAAI Press.
897
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Indyk, P. (2000). Dimensionality reduction techniques for proximity problems. In Proceedings of the Eleventh
Annual ACMSIAM Symposium on Discrete Algorithms, pp. 371378, San Francisco. Asociation for Computing
Machinery.
Ingerman, P. Z. (1967). PaniniBackus form suggested. Communications of the Association for Computing
Machinery, 10(3), 137.
Inoue, K. (2001). Inverse entailment for full clausal theories. In LICS-2001 Workshop on Logic and Learning,
Boston, IEEE.
Intille, S. and Bobick, A. (1999). A framework for recognizing multi-agent action from visual evidence. In
Proceedings of the Sixteenth National Conference on Artificial Intelligence (AAAI-99), pp. 518525, Orlando,
Florida. AAAI Press.
Isard, M. and Blake, A. (1996). Contour tracking by stochastic propagation of conditional density. In
Proceedings of Fourth European conference on Computer Vision, pp. 343356, Cambridge, UK. SpringerVerlag.
Jaakkola, T. and Jordan, M. I. (1996). Computing upper and lower bounds on likelihoods in intractable
networks. In Uncertainty in Artificial Intelligence: Proceedings of the Twelfth Conference, pp. 340348.
Morgan Kaufmann, Portland, Oregon.
Jaakkola, T., Singh, S. P., and Jordan, M. I. (1995). Reinforcement learning algorithm for partially observable
Markov decision problems. In Tesauro, G., Touretzky, D., and Leen, T. (Eds.), Advances in Neural Information
Processing Systems 7, pp. 345352, Cambridge, Massachusets. MIT Press.
Jaffar, J. and Lassez, J.-L. (1987). Constraint logic programming. In Proceedings of the Fourteenth ACM
Conference on Principles of Programming Languages, pp. 111119, Munich. Association for Computing
Machinery.
Jaffar, J., Michaylov, S., Stuckey, P. J., and Yap, R. H. C. (1992a). The CLP(R) language and system. ACM
Transactions on Programming Languages and Systems, 14(3), 339395.
Jaffar, J., Stuckey, P. J., Michaylov, S., and Yap, R. H. C. (1992b). An abstract machine for CLP(R).
SIGPLAN Notices, 27(7), 128139.
Jskowski, S. (1934). On the rules of suppositions in formal logic. Studia Logica, 1.
Jefferson, G. (1949). The mind of mechanical man: The Lister Oration delivered at the Royal College of
Surgeons in England. British Medical Journal, 1(25), 11051121.
Jeffrey, R. C. (1983). The Logic of Decision (2nd edition). University of Chicago Press, Chicago.
Jeffreys, H. (1948). Theory of Probability. Oxford, Oxford, UK.
Jelinek, F. (1969). Fast sequential decoding algorithm using a stack. IBM Journal of Research and
Development, 64, 532556.
Jelinek, F. (1976). Continuous speech recognition by statistical methods. Proceedings of the IEEE, 64(4), 532
556.
Jelinek, F. (1997). Statistical methods for speech recognition. MIT Press, Cambridge, Massachusetts.
Jelinek, F. and Mercer, R. L. (1980). Interpolated estimation of Markov source parameters from sparse data. In
Proceedings of the Workshop on Pattern Recognition in Practice, pp. 381397, Amsterdam, London, New
York. North Holland.
Jennings, H. S. (1906). Behavior of the lower organisms. Columbia University Press, New York.
Jensen, F. V. (2001). Bayesian Networks and Decision Graphs. Springer-Verlag, Berlin.
Jespersen, O. (1965). Essentials of English Grammar. University of Alabama Press, Tuscaloosa, Alabama.
898
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Irodalomjegyzk
Jurafsky, D. and Martin, J. H. (2000). Speech and Language Processing: An Introduction to Natural Language
Processing, Computational Linguistics, and Speech Recognition. Prentice-Hall, Upper Saddle River, New
Jersey.
Kadane, J. B. and Larkey, P. D. (1982). Subjective probability and the theory of games. Management Science,
28(2), 113120.
Kaelbling, L. P., Littman, M. L., and Cassandra, A. R. (1998). Planning and acting in partially observable
stochastic domains. Artificial Intelligence, 101, 99134.
Kaelbling, L. P., Littman, M. L., and Moore, A. W. (1996). Reinforcement learning: A survey. Journal of
Artificial Intelligence Research, 4, 237285.
Kaelbling, L. P. and Rosenschein, S. J. (1990). Action and planning in embedded agents. Robotics and
Autonomous Systems, 6(12), 3548.
Kager, R. (1999). Optimality Theory. Cambridge University Press, Cambridge, UK.
Kahneman, D., Slovic, P., and Tversky, A. (Eds.). (1982). Judgment under Uncertainty: Heuristics and Biases.
Cambridge University Press, Cambridge, UK.
Kaindl, H. and Khorsand, A. (1994). Memory-bounded bidirectional search. In Proceedings of the Twelfth
National Conference on Artificial Intelligence (AAAI-94), pp. 13591364, Seattle. AAAI Press.
Kalman, R. (1960). A new approach to linear filtering and prediction problems. Journal of Basic Engineering,
82, 3546.
Kambhampati, S. (1994). Exploiting causal structure to control retrieval and refitting during plan reuse.
Computational Intelligence, 10, 213244.
Kambhampati, S., Mali, A. D., and Srivastava, B. (1998). Hybrid planning for partially hierarchical domains.
In Proceedings of the Fifteenth National Conference on Artificial Intelligence (AAAI-98), pp. 882888,
Madison, Wisconsin. AAAI Press.
Kanal, L. N. and Kumar, V. (1988). Search in Artificial Intelligence. Springer-Verlag, Berlin.
Kanal, L. N. and Lemmer, J. f. (Eds.) (1986). Uncertainty in Artificial Intelligence. Elsevier/North-Holland,
Amsterdam, London, New York.
Kanazawa, K., Koller, D., and Russell, S. J. (1995). Stochastic simulation algorithms for dynamic probabilistic
networks. In Uncertainty in Artificial Intelligence: proceedings of the Eleventh Conference, pp. 346351,
Montreal, Canada. Morgan Kaufmann.
Kaplan, D. and Montague, R. (1960). A paradox regained. Notre Dame Journal of Formal Logic, 1(3), 7990.
Karmarkar, N. (1984). A new polynomial-time algorithm for linear programming. Combinatorica, 4, 373395.
Karp, R. M. (1972). Reducibility among combinatorial problems. In Miller, R. E. and Thatcher, J. W. (Eds.),
Complexity of Computer Computations, pp. 85103. Plenum, New York.
Kasami, T. (1965). An efficient recognition and syntax analysis algorithm for context-free languages. Tech. rep.
AFCRL-65758, Air Force Cambridge Research Laboratory, Bedford, Massachusetts.
Kasparov, G. (1997). IBM owes me a rematch. Time, 149(21), 6667.
Kasper, R. T. (1988). Systemic grammar and functional unification grammar. In Benson, J. and Greaves, W.
(Eds.), Systemic Functional Approaches to Discourse. Ablex, Norwood, New Jersey.
Kaufmann, M., Manolios, P., and Moore, J. S. (2000). Computer-Aided Reasoning: An Approach. Kluwer,
Dordrecht, Netherlands.
900
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Kautz, H. McAllester, D. A., and Selman, B. (1996). Encoding plans in propositional logic. In Proceedings of
the Fifth International Conference on Principles of Knowledge Representation and Reasoning, pp. 374384,
Cambridge, Massachusetts. Morgan Kaufmann.
Kautz, H. and Selman, b. (1992). Planning as satisfiability. In ECAI 92: 10th European Conference on Artificial
Intelligence Proceedings, pp. 359363, Vienna. Wiley.
Kautz, H. and Selman, B. (1998). BLACKBOX: A new aproach to the application of theorem proving to
problem solving. Working Notes of the AIPS-98 Workshop on Planning as Combinatorial Search.
Kavraki, L., Svestka, P., Latombe, J.-C., and Overmars, M. (1996). Probabilistic roadmaps for path planning in
high-dimensional configuration spaces. IEEE Transactions on Robotics and Automation, 12(4), 566580.
Kay, M., Gawron, J. M., and Norvig, P. (1994). Verbmobil: A Translation System for Face-ToFace Dialog.
CSLI Press, Stanford, California.
Kaye, r. (2000). Minesweeper is NP-complete!. Mathematical Intelligencer, 5(22), 915.
Kearns, M. (1990). The Computational Complexity of Machine Learning. MIT Press, Cambridge,
Massachusetts.
Kearns, M., Mansour, Y., and Ng, A. Y. (2000). Approximate planning in large POMDPs via reusable
trajectories. In Solla, S. A., Leen, T. K., and Mller, K.-R. (Eds.), Advances in Neural Information Processing
Systems 12. MIT Press, Cambridge, Massachusetts.
Kearns, M. and Singh, S. P. (1998). Near-optimal reinforcement learning in polynomial time. In Proceedings of
the Fifteenth International Conference on Machine Learning, pp. 260268, Madison, Wisconsin. Morgan
Kaufmann.
Kearns, M. and Vazirani, U. (1994). An Introduction to Computational Learning Theory. MIT Press,
Cambridge, Massachusetts.
Keeney, R. L. (1974). Multiplicative utility functions. Operations Research, 22, 2234.
Keeney, R. L. and Raiffa, H. (1976). Decisions with Multiple Objectives: preferences and Value Tradeoffs.
Wiley, New York.
Kehler, A. (1997). Probabilistic coreference in information extraction. In Cardie, C. and Weischedel, R. (Eds.),
Proceedings of the Second Conference on Empirical Methods in Natural Language Processing, pp. 163173.
Association for Computational Linguistics, Somerset, New Jersey.
Kemp, M. (Ed.). (1989). Leonardo on Painting: An Anthology of Writings. Yale University Press, New Haven,
Connecticut.
Kern, C. and Greenstreet, M. R. (1999). Formal verification in hardware design: A survey. ACM Transactions
on Design Automation of Electronic Systems, 4(2), 123193.
Keynes, J. M. (1921). A Treatise on Probability. Macmillan, London.
Khatib, O. (1986). Real-time obstacle avoidance for robot manipulator and mobile robots. The International
Journal of Robotics Research, 5(1), 9098.
Kietz, J.-U. and Dzeroski, S. (1994). Inductive logic programming and learnability. SIGART Bulletin, 5(1), 22
32.
Kim, J. H. (1983). CONVINCE: A Conversational Inference Consolidation Engine. Ph.D. thesis, Department of
Computer Science, University of California at Los Angeles.
Kim, J. H. and Pearl, J. (1983). A computational model for combined causal and diagnostic reasoning in
inference systems. In Proceedings of the Eighth International Joint Conference on Artificial Intelligence
(IJCAI-83), pp. 190193, Karlsruhe, Germany. Morgan Kaufmann.
901
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Kim, J. H. and Pearl, J. (1987). CONVINCE: A conversational inference consolidation engine. IEEE
Transactions on Systems, Man, and Cybernetics, 17(2), 120132.
King, R. D., Muggleton, S. H., Lewis, R. A., and Sternberg, M. J. E. (1992). Drug design by machine learning:
The use of inductive logic programming to model the structure activity relationships of trimethoprim analogues
binding to dihydrofolate reductase. Proceedings of the National Academy of Sciences of the United States of
America, 89(23), 1132211326.
Kirkpatrick, S., Gelatt, C. D., and Vecchi, M. P. (1983). Optimization by simulated annealing. Sience, 220,
671680.
Kirkpatrick, S. and Selman, b. (1994). Critical behavior in the satisfiability of random Boolean expressions.
Science, 264(5163), 12971301.
Kirousis, L. M. and Papadimitriou, C. H. (1988). The complexity of recognizing polyhedral scenes. Journal of
Computer and System Sciences, 37(1), 1438.
Kitano, H., Asada, M., Kuniyoshi, Y., Noda, I., and Osawa, E. (1997). RoboCup: The robot world cup
initiative. In Johnson, W. L. and Hayes-Roth, B. (Eds.), Proceedings of the First International Conference on
Autonomous Agents, pp. 340347, New York. ACM Press.
Kjaerulff, U. (1992). A computational scheme for reasoning in dynamic probabilistic networks. In Uncertainty
in Artificial Intelligence: Proceedings of the Eighth Conference, pp. 121129, Stanford, California. Morgan
Kaufmann.
Klein, D. and Manning, C. D. (2001). Parsing with treebank grammars: Empirical bounds, theoretical models,
and the structure of the Penn treebank. In Proceedings of the 39th Annual Meeting of the ACL.
Kleinberg, J. M. (1999). Authoritative sources in a hyperlinked environment. Journal of the ACM, 46(5), 604
632.
Knight, K. (1999). A statistical mt tutorial workbook. prepared in connection with the Johns Hopkins
University summer workshop.
Knoblock, c. A. (1990). Learning abstraction hierarchies for problem solving. In Proceedings of the Eighth
National Conference on Artificial Intelligence (AAAI-90), Vol. 2, pp. 923928, Boston. MIT Press.
Knuth, D. E. (1968). Semantics for context-free languages. Mathematical Systems Theory, 2(2), 127145.
Knuth, D. E. (1973). The Art of Computer Programming (second edition)., Vol. 2: Fundamental Algorithms.
Addison-Wesley, Reading, Massachusetts.
Knuth, D. E. (1975). An analysis of alphabeta pruning. Artificial Intelligence, 6(4), 293326.
Knuth, D. E. and Bendix, P. B. (1970). Simple word problems in universal algebras. In Leech, J. (Ed.),
Computational Problems in Abstract Algebra, pp. 263267. Pergamon, Oxford, UK.
Koditschek, D. (1987). Exact robot navigation by means of potential functions: some topological
considerations. In Proceedings of the 1987 IEEE International Conference on Robotics and Automation, Vol. 1,
pp. 16, Raleigh, North Carolina. IEEE Computer Society Press.
Koehler, J., Nebel, B., Hoffman, J., and Dimopoulos, y. (1997). Extending planning graphs to an ADL subset.
In Proceedings of the Fourth European Conference on Planning, pp. 273285, Toulouse, France. SpringerVerlag.
Koenderink, J. J. (1990). Solid Shape. MIT Press, Cambridge, Massachusetts.
Koenderink, J. J. and van Doorn, A. J. (1975). Invariant properties of the motion parallax field due to the
movement of rigid bodies relative to an boserver. Optica Acta, 22(9), 773791.
Koenderink, J. J. and van Doorn, A. J. (1991). Affine structure from motion. Journal of the Optical Society of
America A, 8, 377385.
902
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Koenig, s. (1991). Optimal probabilistic and decision-theoretic planning using Markovian decision theory.
Masters report, Computer Science Division, University of California, Berkeley.
Koenig, S. (2000). Exploring unknown environments with real-time search or reinforcement learning. In solla,
S. A., Leen, T. K., and Mller, K.-R. (Eds.), Advances in Neural Information Processing Systems 12. MIT
Press, Cambridge, Massachusetts.
Koenig, s. and Simmons, R. (1998). Solving robot navigation problems with initial pose uncertainty using realtime heuristic search. In aips98. AAAI Press, Menlo Park, California.
Kohn, W. (1991). Declarative control architecture. Communications of the Association for Computing
Machinery, 34(8), 6579.
Koller, D., Meggido, N., and von Stengel, B. (1996). Efficient computation of equilibria for extensive twoperson games. Games and Economic Behaviour, 14(2), 247259.
Koller, D. and Pfeffer, A. (1997). Representations and solutions for game-theoretic problems. Artificial
Intelligence, 94(12), 167215.
Koller, d. and Pfeffer, a. (1998). Probabilistic frame-based systems. In Proceedings of the Fifteenth National
Conference on Artificial Intelligence (AAAI-98), pp. 580587, Madison, Wisconsin. AAAI Press.
Koler, d. and Sahami, M. (1997). Hierarchically classifying documents using very few words. In Proceedings of
the Fourteenth International Conference on Machine Learning, pp. 170-178. Morgan Kaufmann.
Kolmogorov, A. N. (1941). Interpolation und extrapolation von stationaren zufalligen folgen. Bulletin of the
Academy of Sciences of the USSR, Ser. Math. 5, 314.
Kolmogorov, A. N. (1950). Foundations of the Theory of Probability. Chelsea, New York.
Kolmogorov, A. N. (1963). On tables of random numbers. Sankhya, the Indian Journal of Statistics, Series A
25.
Kolmogorov, A. N. (1965). Three approaches to the quantitative definition of information. Problems in
Information Transmission, 1(1), 17.
Kolodner, J. (1983). Reconstructive memory: A computer model. Cognitive Science, 7, 281328.
Kolodner, J. (1993). Case-Based Reasoning. Morgan Kaufmann, San Mateo, California.
Kondrak, G. and van Beek, P. (1997). A theoretical evaluation of selected backtracking algorithms. Artificial
Intelligence, 89, 365387.
Konolige, K. (1997). COLBERT: A language for reactive control in Saphira. In KI-97: Advances in Artificial
Intelligence, LNAI, p. 3152. Springer-Verlag.
Konolige, K. (1982). A first order formalization of knowledge and action for a multi-agent planning system. In
Hayes, J. E., Michie, D., and Pao, Y.-H. (Eds.), Machine Intelligence 10. Ellis Horwood, Chichester, England.
Koopmans, T. C. (1972). Representation of preference orderings over time. In McGuire, C. B. and Radner, R.
(Eds.), Decision and Organization. Elsevier/North-Holland, Amsterdam, London, New York.
Korf, R. E. (1985a). Depth-first iterative-deepening: an optimal admissible tree search. Artificial Intelligence,
27(1), 97109.
Korf, R. E. (1985b). Iterative-deepening A*: An optimal admissible tree search. In Proceedings of the Ninth
International Joint Conference on Artificial Intelligence (IJCAI-85), pp. 10341036, Los Angeles. Morgan
Kaufmann.
Korf, R. E. (1987). Planning as search: A quantitative approach. Artificial Intelligence, 33(1), 6588.
Korf, R. E. (1988). Optimal path finding algorithms. In Kanal, L. N. and Kumar, V. (Eds.), Search in Artificial
Intelligence, chap. 7, pp. 223267. Springer-Verlag, Berlin.
903
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
904
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Kuhn, H. W. (1953). Extensive games and the problem of information. In Kuhn, H. W. and Tucker, A. W.
(Eds.), Contributions to the Theory of Games II. Princeton University Press, Princeton, New Jersey.
Kuipers, B. J. and Levitt, T. S. (1988). Navigation and mapping in large-scale space. AI Magazine, 9(2), 2543.
Kukich, K. (1992). Techniques for automatically correcting words in text. ACM Computing Surveys, 24(4),
377439.
Kumar, P. R. and Varaiya, P. (1986). Stochastic systems: Estimation, identification, and adaptive control.
Prentice-Hall, Upper Saddle River, New Jersey.
Kumar, V. (1992). Algortihms for constraint satisfaction problems: A survey. AI Magazine, 13(1), 3244.
Kumar, V. and Kanal, L. N. (1983). A general branch and bound formulation for understanding and
synthesizing and/or tree search procedures. Artificial Intelligence, 21, 179198.
Kumar, V. and Kanal, L. N. (1988). The CDP: A unifying formulation for heuristic search, dynamic
programming, and branch-and-bound. In Kanal, L. N. and Kumar, V. (Eds.), Search in Artificial Intelligence,
chap. 1, pp. 127. Springer-Verlag, Berlin.
Kumar, V., Nau, D. S., and Kanal, L. N. (1988). A general branch-and bound formulation for AND/OR grap
and game tree search. In Kanal, L. N. and Kumar, V. (Eds.), Search in Artificial Intelligence, chap. 3, pp. 91
130. Springer-Verlag, Berlin.
Kuper, g. M. and Vardi, M. Y. (1993). On the complexity of queries in the logical data model. Theoretical
Computer Science, 116(1), 3357.
Kurzweil, R. (1990). The Age of Intelligent Machines. MIT Press, Cambridge, Massachusetts.
Kurzweil, r. (2000). The Age of Spiritual Machines. Penguin.
Kyburg, H. E. (1977). Randomness and the right reference class. The Journal of Philosophy, 74(9), 501521.
Kyburg, H. E. (1983). The reference class. Philosophy of Science, 50, 374397.
La Mettrie, J. O. (1748). Lhomme machine. E. Luzac, Leyde, France.
La Mura, P. and Shoham, Y. (1999). Expected utility networks. In Uncertainty in Artificial Intelligence:
Proceedings of the Fifteenth Conference, pp. 366373, Stockholm. Morgan Kaufmann.
Ladkin, P. (1986a). Primitives and units for time specification. In Proceedings of the Fifth National Conference
on Artificial Intelligence (AAAI-86), Vol. 1, pp. 354359, Philadelphia. Morgan Kaufmann.
Ladkin, P. (1986b). Time representation: a taxonomy of interval relations. In Proceedings of the Fifth National
Conference on Artificial Intelligence (AAAI-86), Vol. 1, pp. 360366, Philadelphia. Morgan Kaufmann.
Lafferty, J. and Zhai, C. (2001). Probabilistic relevance models based on document and query generation. In
Proceedings of the Workshop on Language Modelling and Information retrieval.
Laird, J. E., Newell, A., and Rosenbloom, P. S. (1987). SOAR: An architecture for general intelligence.
Artificial Intelligence, 33(1), 164.
Laird, J. E., Rosenbloom, P. S., and Newell, A. (1986). Chunking in Soar: The anatomy of a general learning
mechanism. Machine Learning, 1, 1146.
Lakoff, G. (1987). Women, Fire, and Dangerous Things: What Categories Reveal about the Mind. University
of Chicago Press, Chicago.
Lakoff, G. and Johnson, M. (1980). Metaphors We Live By. University of Chicago Press, Chicago.
Lamarck, J. B. (1809). Philosophie zoologique. Chez Dentu et LAuteur, Paris.
905
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Langley, P., Simon, H. A., Bradshaw, G. L., and Zytkow, J. M. (1987). Scientific Discovery: Computational
Explorations of the Creative Processes. MIT Press, Cambridge, Massachusetts.
Langton, C. (Ed.). (1995). Artificial life. MIT Press, Cambridge, Massachusetts.
Laplace, P. (1816). Essai philosophique sur les probabilits (3rd edition). Courcier Imprimeur, Paris.
Lappin, S. and Leass, H. J. (1994). An algorithm for pronominal anaphora resolution. Computational
Linguistics, 20(4), 535561.
Lari, K. and Young, S. J. (1990). The estimation of stochastic context-free grammars using the inside-outside
algorithm. Computer, Speech and Language, 4, 3556.
Larraaga, P., Kuijpers, C., Murga, R., Inza, I., and Dizdarevic, S. (1999). Genetic algorithms for the travelling
salesman problem: A review of representations and operators. Artificial Intelligence Review, 13, 129170.
Latombe, J.-C. (1991). Robot Motion Planning. Kluwer, Dordrecht, Netherlands.
Lauritzen, S. (1995). The EM algorithm for graphical association models with missing data. Computational
Statistics and Data Analysis, 19, 191201.
Lauritzen, S. (1996). Graphical models. Oxford University Press, Oxford, UK.
Lauritzen, S., Dawid, A., Larsen, B., and Leimer, H. (1990). Independence properties of directed Markov
fields. Networks, 20(5), 491505.
Lauritzen, S. and Spiegelhalter, D. J. (1988). Local computations with probabilities on graphical structures and
their application to expert systems. Journal of the Royal Statistical Society, B 50(2), 157224.
Lauritzen, S. and Wermuth, N. (1989). Graphical models for associations between variables, some of which are
qualitative and some quantitative. Annals of Statistics, 17, 3157.
Lavrac, N. and Dzeroski, S. (1994). Inductive Logic Programming: Techniques and Applications. Ellies
Horwood, Chichester, England.
Lawler, E. L. (1985). The travelling salesman problem: A guided tour of combinatorial optimization. Wiley,
New York.
Lawler, E. L., Lenstra, J. K., Kan, A., and Shmoys, D. B. (1992). The Travelling Salesman Problem. Wiley
Interscience.
Lawler, E. L., Lenstra, J. K., Kan, A., and Shmoys, D. B. (1993). Sequencing and scheduling: algorithms and
complexity. In Graves, S. c., Zipkin, P. H., and Kan, A. h. g. r. (Eds.), Logistics of Production and Inventory:
Handbooks in Operations Research and Management Science, Volume 4, pp. 445522. North-Holland,
Amsterdam.
Lawler, E. L. and Wood, D. E. (1966). Branch-and-bound methods: A survey. Operations Research, 14(4),
699719.
Lazanas, A. and Latombe, J.-C. (1992). Landmark-based robot navigaton. In Preceedings of the Tenth National
Conference on Artificial Intelligence (AAAI-92), pp. 816822, San Jose. AAAI Press.
Le Cun, Y., Jackel, L., Boser, B., and Denker, J. (1989). Handwritten digit recognition: Applications of neural
network chips and automatic learning. IEEE Communications Magazine, 27(11), 4146.
LeCun, Y., Jackel, L., Bottou, L., Brunot, A., Cortes, C., Denker, J., Drucker, H., Guyon, I., Muller, U.,
Sackinger, E., Simard, P., and Vapnik, V. N. (1995). Comparison of learning algorithms for handwritten digit
recognition. In Fogelman, F. and Gallinari, P. (Eds.), International Conference on Artificial Neural Networks,
pp. 5360, Berlin. Springer-Verlag.
Leech, G., Rayson, P., and Wilson, A. (2001). Word Frequencies in Written and Spoken English: Based on the
British National Corpus. Longman, New York.
906
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Lefkovitz, D. (1960). A strategic pattern recognition program for the game Go. Technical note 60243, Wright
Air Development Division, University of Pennsylvania, Moore School of Electrical Engineering.
Lenat, D. B. (1983). EURISKO: A program that learns new heuristics and domain concepts: The nature of
heuristics, III: Program design and results. Artificial Intelligence, 21(12), 6198.
Lenat, D. B. (1995). Cyc: A large-scale investment in knowledge infrastructure. Communications of the ACM,
38(11).
Leant, D. B. and Brown, J. S. (1984). Why AM and EURISKO appear to work. Artificial Intelligence, 23(3),
269294.
Leant, D. B. and Guha, R. V. (1990). Building Large Knowledge-Based Systems: Representation and Inference
in the CYC project. Addison-Wesley, Reading, Massachusetts.
Leonard, H. S. and Goodman, N. (1940). The calculus of individuals and its uses. Journal of Symbolic Logic,
5(2), 4555.
Leonard, J. J. and Durrant-Whyte, H. (1992). Directed sonar sensing for mobile robot navigation. Kluwer,
Dordrecht, Netherlands.
Lesniewski, S. (1916). Podstawy oglnej teorii mnogosci. Moscow.
Lettvin, J. Y., Maturana, H. R., McCulloch, W. S., and Pitts, W. H. (1959). What the frogs eye tells the frogs
brain. Proceedings of the IRE, 47(11), 19401951.
Letz, r., Schumann, J., Bayerl, S., and Bibel, W. (1992). SETHEO: A high-performance theorem prover.
Journal of Automated Reasoning, 8(2), 183212.
Levesque, H. J. and Brachman, R. J. (1987). Expressiveness and tractability in knowledge representation and
reasoning. Computational Intelligence, 3(2), 7893.
Levesque, H. J., Reiter, R., Lesprance, Y., Lin, F., and Scherl, R. (1997a). GOLOG: A logic programming
language for dynamic domains. Journal of Logic Programming, 31, 5984.
Levesque, H. J., Reiter, R., Lesprance, y., Lin, F., and Scherl, R. (1997b). GOLOG: A logic programming
language for dynamic domains. Journal of Logic Programming, 31, 5984.
Levitt, G. M. (2000). The Turk, Chess Automation. McFarland and Company.
Levy, D. N. L. (Ed.). (1988a). Computer Chess Compendium. Springer-Verlag, Berlin.
Levy, d. N. L. (Ed.). (1988b). Computer Games. Springer-Verlag, Berlin.
Lewis, D. D. (1998). Naive Bayes at forty: The independence assumption in information retrieval. In Machine
Learning: ECML-98. 10th European Conference on Machine Learning. Proceedings, pp. 415, Chemnitz,
Germany. Springer-Verlag.
Lewis, D. K. (1966). An argument for the identity theory. the Journal of Philosophy, 63(1), 1725.
Lewis, D. K. (1972). General semantics. In Davidson, d. and Harman, G. (Eds.), Semantics of Natural
Language, pp. 169218. Reidel, Dordrecht, Netherlands.
Lewis, D. K. (1980). Mad pain and Martian pain. In Block, N. (Ed.), Readings in Philosophy of Psychology,
Vol. 1, pp. 216222. Harvard University Press, Cambridge, Massachusetts.
Li, C. M. and Anbulagan (1997). Heuristics based on unit propagation for satisfiability problems. In
Proceedings of the Fifteenth International Joint Conference on Artificial Intelligence (IJCAI-97), pp. 366371,
Nagoya, Japan. Morgan Kaufmann.
Li, M. and Vitanyi, P. M. B. (1993). An Introduction to Kolmogorov Complexity and Its Applications. SpringerVerlag, Berlin.
907
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Lifschitz, V. (1986). On the semantics of STRIPS. In Georgeff, M. P. and Lansky, a. L. (Eds.), Reasoning about
Actions and Plans: Proceedings of the 1986 Workshop, pp. 19, timberline, Oregon. Morgan Kaufmann.
Lifschitz, V. (2001). Answer set programming and plan generation. Artificial Intelligence, 138(12), 3954.
Lighthill, J. (1973). Artificial intelligence: A general survey. In Lighthill, J., Sutherland, N. s., Needham, r. M.,
Longuet-Higgins, H. c., and Michie, D. (Eds.), Artificial Intelligence: A Paper Symposium. Science Research
Council of Great Britain, London.
Lin, F. and Reiter, R. (1997). How to progress a database. Artificial Intelligence, 92(12), 131167.
Lin, S. (1965). Computer solutions of the travelling salesman problem. Bell Systems Technical Journal, 44(10),
22452269.
Lin, S. and Kernighan, b. W. (1973). An effective heuristic algorithm for the travelling-salesman problem.
Operations Research, 21(2), 498516.
Linden, T. A. (1991). Representing software design as partially developed plans. In Lowry, M. R. and
McCartney, R. D. (Eds.), Automating Software Design, pp. 603625. MIT Press, Cambridge, Massachusetts.
Lindsay, r. K. (1963). Inferential memory as the basis of machines which understand natural language. In
Feigenbaum, E. A. and Feldman, J. (Eds.), Computers and Thought, pp. 217236. McGraw-Hill, New Jork.
Lindsay, R. K., Buchanan, B. G., Feigenbaum, E. A., and Lederberg, J. (1980). Applications of Artificial
Intelligence for Organic Chemistry: The DENDRAL Project. McGraw-Hill, New York.
Littman, M. L. (1994). Markov games as a framework for multi-agent reinforcement learning. In Proceedings
of the 11th International Conference on Machine Learning (ML-94), pp. 157163, Mew Brunswick, NJ.
Morgan Kaufmann.
Littman, M. L., Keim, g. A., and Shazeer, N. M. (1999). Solving crosswords with PROVERB. In Proceedings
of the Sixteenth National Conference on Artificial Intelligence (AAAI-99), pp. 914915, Orlando, Florida. AAAI
Press.
Liu, J. S. and Chen, R. (1998). Sequential Monte Carlo methods for dynamic systems. Journal of the American
Statistical Association, 93, 10221031.
Lloyd, J. W. (1987). Foundations of Logic Programming. Springer-Verlag, Berlin.
Locke, J. (1690). An Essay Concerning Human Understanding. William Tegg.
Locke, W. N. and Booth, A. D. (1955). Machine Translation of Languages: Fourteen Essays. MIT Press,
Cambridge, Massachusetts.
Lodge, D. (1984). Small World. Penguin Books, New York.
Lohn, J. D., Kraus, W. F., and Colombano, S. P. (2001). Evolutionary optimization of yagi-uda antennas. In
Proceedings of the Fourth International Conference on Evolvable Systems, pp. 236243.
Longuet-Higgins, H. C. (1981). A computer algorithm for reconstructing a scene from two projections. Nature,
293, 133135.
Lovejoy, W. S. (1991). A survey of algorithmic methods for partially observed Markov decision processes.
Annals of Operations Research, 28(14), 4766.
Loveland, D. (1968). Mechanical theorem proving by model elimination. Journal of the Association for
Computing Machinery, 15(2), 236251.
Loveland, d. (1970). A linear format for resolution. In Proceedings of the IRIA Symposium on Automatic
Demonstration, pp. 147162, Berlin. Springer-Verlag.
Loveland, D. (1984). Automated theorem-proving: A quarter-century review. Contemporary Mathematics, 29,
145.
908
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Lowe, D. g. (1987), Three-dimensional object recognition from single two-dimensional images. Artificial
Intelligence, 31, 355395.
Lwenheim, L. (1915). ber mglichkeiten im Relativkalkl. Mathematische Annalen, 76, 447 470.
Lowerre, b. T. (1976). The Harpy Speech Recognition System. Ph.D. thesis, Computer Science Department,
Carnegie-Mellon University, Pittsburgh, Pennsylvania.
Lowerre, B. T. and Reddy, R. (1980). The harpy speech recognition system. In Lea, W. A. (Ed.), Trends in
Speech Recognition, chap. 15. Prentice-Hall, Upper Saddle River, New Jersey.
Lowry, M. R. and McCartney, R. D. (1991). Automating Software Design. MIT Press, Cambridge,
Massachusetts.
Loyd, D. (1959). Mathematical Puzzles of Sam Loyd: Selected and Edited by Martin Gardner. Dover, New
York.
Lozano-Perez, T. (1983). Spatial planning: A configuration space approach. IEEE Transactions on Computers,
C-32(2), 108120.
Lozano-Perez, T., Mason, M., and Tylor, R. (1984). Automatic synthesis of fine-motion strategies for robots.
International Journal of Robotics Research, 3(1), 324.
Luby, M., Sinclair, A., and Zuckerman, D. (1993). Optimal speedup of Las Vegas algorithms. Information
Processing Letters, 47, 173180.
Luby, M. and Vigoda, E. (1999). Fast convergence of the glauber dynamics for sampling independent sets.
Random Structures and Algorithms, 15(34), 229241.
Lucas, J. R. (1961). Minds, machines, and Gdel. Philosophy, 36.
Lucas, J. R. (1976). This Gdel is killing me: A rejoinder. Philosophia, 6(1), 145148.
Lucas, P. (1996). Knowledge acquisition for decision-theoretic expert systems. AISB Quarterly, 94, 2333.
Luce, D. R. and Raiffa, H. (1957). Games and Decisions. Wiley, New York.
Luger, G. F. (Ed.). (1995). Computation and intelligence: Collected readings. AAAI Press, Menlo Park,
California.
MacKay, D. J. C. (1992). a practical Bayesian framework for back-propagation networks. Neural Computation,
4(3), 448472.
Mackworth, A. K. (1973). Interpreting pictures of polyhedral scenes. Artificial Intelligence, 4, 121137.
Mackworth, A. K. (1977). Consistency in networks of relations. Artificial Intelligence, 8(1), 99118.
Mackworth, A. K. (1992). Constraint satisfaction. In Shapiro, S. (Ed.), Encyclopedia of Artificial Intelligence
(second edition)., Vol. 1, pp. 285293. Wiley, New York.
Mahanti, A. and Daniels, C. J. (1993). A SIMD approach to parallel heuristic search. Artificial Intelligence,
60(2), 243282.
Majercik, S. M. and Littman, M. L. (1999). Planning under uncertainty via stochastic satisfiability. In
Proceedings of the Sixteenth National Conference on Artificial Intelligence, pp. 549556.
Malik, J, (1987). Interpreting line drawings of curved objects. International Journal of Computer Vision, 1(1),
73103.
Malik, J. and Rosenholtz, r. (1994). Recovering surface curvature and orientation from texture distortion: A
least squares algorithm and sensitivity analysis. In Eklundh, J.-O. (Ed.), Proceedings of the Third European
Conf. on Computer Vision, pp. 353364, Stockholm. Springer-Verlag.
909
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Malik, J. and Rosenholtz, R. (1997). Computing local surface orientation and shape from texture for curved
surfaces. International Journal of Computer Vision, 23(2), 149168.
Mann, W. C. and Thompson, S. A. (1983). Relational propositions in discourse. Tech. rep. RR-83-115,
Information Sciences Institute.
Mann, W. C. and Thompson, S. A. (1988). Rhetorical structure theory: Toward a functional theory of text
organization. Text, 8(3), 243281.
Manna, Z. and Waldinger, R. (1971). Toward automatic program synthesis. Communications of the Association
for Computing Machinery, 14(3), 151165.
Manna, Z. and Waldinger, R. (1985). The Logical Basis for Computer Programming: Volume 1: Deductive
Reasoning. Addison-Wesley, Reading, Massachusets.
Manna, Z. and Waldinger, R. (1986). Special relations in automated deduction. Journal of the Association for
Computing Machinery, 33(1), 159.
Manna, Z. and Waldinger, R. (1992). Fundamentals of deductive program synthesis. IEEE Transactions on
Software Engineering, 18(8), 674 704.
Manning, C. D. and Schtze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press.
Marbach, P. and Tsitsiklis, J. N. (1998). Simulation-based optimization of Markov reward processes. Technical
report LIDS-P-2411, Laboratory for Information and Decision Systems, Massachusetts Institute of Technology.
Marcus, M. P., Santorini, B., and Marcinkiewicz, M. A. (1993). Building a large annotated corpus of english:
The penn treebank. Computational Linguistics, 19(2), 313330.
Markov, A. A. (1913). An example of statistical investigation in the text of Eugene Onegin illustrating
coupling of tests in chains. Proceedings of the Academy of Sciences of St. Petersburg, 7.
Maron, M. E. (1961). Automatic indexing: An experimental inquiry. Journal of the Association for Computing
Machinery, 8(3), 404417.
Maron, M. E. and Kuhns, J.-L. (1960). On relevance, probabilistic indexing and information retrieval.
Communications of the ACM, 7, 219244.
Marr, D. (1982). Vision: A Computational Investigation into the Human Representation and Processing of
Visual Information. W. H. Freeman, New York.
Marriott, K. and Stuckey, P. J. (1998). Programming with Constraints: An Introduction. MIT Press,
Cambridge, Massachusetts.
Marsland, a. T. and Schaeffer, J. (Eds.). (1990). Computers, Chess, and Cognition. Springer-Verlag, Berlin.
Martelli, A. and Montanari, U. (1976). Unification in linear time and space: A structured presentation. Internal
report B 76-16, Istituto di Elaborazione della Informazione, Pisa, Italy.
Martelli, A. and Montanari, U. (1978). Optimizing decision trees through heuristically guided search.
Communications of the Association for Computing Machinery, 21, 10251039.
Marthi, B., Pasula, H., Russell, S. J., and Peres, Y. (2002). Decayed MCMC filtering. In Uncertainty in
Artificial Intelligence: Proceedings of the Eighteenth Conference, pp. 319326, Edmonton, Alberta. Morgan
Kaufmann.
Martin, J. H. (1990). A Computational Model of Metaphor Interpretation. Academic Press, New York.
Martin, P. and Shmoys, D. B. (1996). A new approach to computing optimal schedules for the jobshop
scheduling problem. In Proceedings of the 5th International IPCO Conference, pp. 389403. Springer-Verlag.
Maslov, S. Y. (1964). An inverse method for establishing deducibility in classical predicate calculus. Doklady
Akademii nauk SSSR, 159, 1720.
910
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Maslov, S. Y. (1967). An inverse method for establishing deducibility of nonprenex formulas of the predicate
calculus. Doklady Akademii nauk SSSR, 172, 2225.
Mason, M. (1993). Kicking the sensing habit. AI Magazine, 14(1), 5859.
Mason, M. (2001). Mechanics of Robotic Manipulation. MIT Press.
Mason, M. and Salisbury, J. (1985). Robot hands and the mechanics of manipulation. MIT Press.
Mataric, M. J. (1997). Reinforcement learning in the multi-robot domain. Autonomous Robots, 4(1), 7383.
Mates, B. (1953). Stoic Logic. University of California Press, Berkeley and Los Angeles.
Maxwell, J. and Kaplan, r. (1993). The interface between phrasal and functional constraints. Computational
Linguistics, 19(4), 571590.
Maxwell, J. and Kaplan, R. (1995). A method for disjunctive constraint satisfaction. In Dalrymple, M., Kaplan,
r., Maxwell, J., and Zaenen, A. (Eds.), Formal Issues in Lexical-Functional Grammar, No. 47 in CSLI Lecture
Note Series, chap. 14, pp. 381481. CSLI Publications.
McAllester, D. A. (1980). An outlook on truth maintenance. Ai memo 551, MIT AI Laboratory, Cambridge,
Massachusetts.
McAllester, D. A. (1988). Conspiracy numbers for min-max search. Artificial Intelligence, 35(3), 287310.
McAllester, D. A. (1989). Ontic: A Knowledge Representation System for Mathematics. MIT Press, Cambridge,
Massachusetts.
McAllester, D. A. (1998). What is the most pressing issue facing ai and the aaai today?. Candidate statement,
election for Councilor of the American Association for Artificial Intelligence.
McAllester, D. A. and Givan, R. (1992). Natural language syntax and first-order inference. Artificial
Intelligence, 56(1), 120.
McAllester, D. A. and Rosenblitt, D. (1991). Systematic nonlinear planning. In Proceedings of the Ninth
National Conference on Artificial Intelligence (AAAI-91), Vol. 2, pp. 634639, Anaheim, California. AAAI
Press.
McCarthy, J. (1958). Programs with common sense. In Proceedings of the Symposium on Mechanisation of
Thought Processes, Vol. 1, pp. 7784, London. Her Majestys Stationery Office.
McCarthy, J. (1963). Situations, actions, and causal laws. Memo 2, Stanford University Artificial Intelligence
Project, Stanford, California.
McCarthy, J. (1968). Programs with common sense. In Minsky, M. L. (Ed.), Semantic Information Processing,
pp. 403418. MIT Press, Cambridge, Massachusetts.
McCarthy, J. (1980). Circumscription: A form of non-monotonic reasoning. Artificial Intelligence, 13(12),
2739.
McCarthy, J. and Hayes, P. J. (1969). Some philosophical problems from the standpoint of artificial
intelligence. In Meltzer, B., Michie, D., and Swann, M. (Eds.), Machine Intelligence 4, pp. 463502. Edinburgh
University Press, Edinburgh, Scotland.
McCarthy, J., Minsky, M. L., Rochester, N., and Shannon, c. E. (1955). Proposal for the Dartmouth summer
research project on artificial intelligence. Tech. rep., Dartmouth College.
McCawley, J. D. (1988). The Syntactic Phenomena of English, Vol. 2 volumes. University of Chicago Press.
McCawley, J. D. (1993). Everything That Linguists Have Always Wanted to Know about Logic but Were
Ashamed to Ask (Second edition). University of Chicago Press, Chicago.
911
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
McCulloch, W. S. and Pitts, W. (1943). A logical calculus of the ideas immanent in nervous activity. Bulletin of
Mathematical Biophysics, 5, 115137.
McCune, W. (1992). Automated discovery of new axiomatizations of the left group and right group calculi.
Journal of Automated Reasoning, 9(1), 124.
McCune, W. (1997). Solution of the robbins problem. Journal of Automated Reasoning, 19(3), 263276.
McDermott, D. (1976). Artificial intelligence meets natural stupidity. SIGART Newsletter, 57, 49.
McDermott, D. (1978a). Planning and acting. Cognitive Science, 2(2), 71109.
McDermott, D. (1978b). Tarskian semantics, or, no notation without denotation!. Cognitive Science, 2(3).
McDermott, D. (1987). A critique of pure reason. Computational Intelligence, 3(3), 151237.
McDermott, D. (1996). A heuristic estimator for means-ends analysis in planning. In Proceedings of the Third
International Conference on AI Planning Systems, pp. 142149, Edinburgh, Scotland. AAAI Press.
McDermott, D. and Doyle, J. (1980). Non-monotonic logic: i. Artificial Intelligence, 13(12), 4172.
McDermott, J. (1982). R1: A rule-based configurer of computer systems. Artificial Intelligence, 19(1), 3988.
McEliece, R. J., MacKay, D. J. C., and Cheng, J.-F. (1998). Turbo decoding as an instance of Pearls belief
propagation algorithm. IEEE Journal on Selected Areas in Communications, 16(2), 140 152.
McGregor, J. J. (1979). Relational consistency algorithms and their application in finding subgraph and graph
isomorphisms. Information Sciences, 19(3), 229250.
McKeown, K. (1985). Text Generation: Using Discourse Strategies and Focus Constraints to Generate Natural
Language Text. Cambridge University Press, Cambridge, UK.
McLachlan, g. J. and Krishnan, t. (1997). The EM Algorithm and Extensions. Wiley, New York.
McMillan, K. L. (1993). Symbolic Model Checking. Kluwer, Dordrecht, Netherlands.
Meehl, P. (1955). Clinical vs. Statistical Prediction. University of Minnesota Press, Minneapolis.
Melcuk, I. A. and Polguere, A. (1988). A formal lexicon in the meaning-text theory (or how to do lexica with
words). Computational Linguistics, 13(34), 261275.
Mendel, G. (1866). Versuche ber pflanzen-hybriden. Verhandlungen des Naturforschenden Vereins,
Abhandlungen, Brnn, 4, 347. Translated into English by C. T. Druery, published by Bateson (1902).
Mercer, J. (1909). Functions of positive and negative type and their connection with the theory of integral
equations. Philos. Trans. Roy. Soc. London, A, 209, 415446.
Metropolis, N., Rosenbluth, A., Rosenbluth, M., Teller, A., and Teller, E. (1953). Equations of state
calculations by fast computing machines. Journal of Chemical Physics, 21, 10871091.
Mzard, M. and Nadal, J.-P. (1989). Learning in feed-forward layered networks: The tiling algorithm. Journal
of Physics, 22, 21912204.
Michalski, R. S. (1969). On the quasi-minimal solution of the general covering problem. In Proceedings of the
First International Symposium on Information Processing, pp. 125128.
Michalski, R. S., Carbonell, J. G., and Mitchell, T. M. (Eds.). (1983). Machine Learning: An Artificial
Intelligence Approach, Vol. 1. Morgan Kaufmann, San Mateo, California.
Michalski, r. S., Carbonell, J. G., and Mitchell, T. M. (Eds.). (1986a). Machine Learning: An Artificial
Intelligence Approach, Vol. 2. Morgan Kaufmann, San Mateo, California.
912
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Michalski, r. S., Mozetic, I., Hong, J., and Lavrac, N. (1986b). The multi-purpose incremental learning system
aq15 and its testing application to three medical domains. In Proceedings of the Fifth National Conference on
Artificial Intelligence (AAAI-86), pp. 10411045, Philadelphia. Morgan Kaufmann.
Michel, S. and Plamondon, P. (1996). Bilingual sentence alignment: Balancing robustnes and accuracy. In
Proceedings of the Conference of the Association for Machine Translation in the Americas (AMTA).
Michie, d. (1966). Game-playing and game-learning automata. In Fox, L. (Ed.), Advances in Programming and
Non-Numerical Computation, pp. 183 200. Pergamon, Oxford, UK.
Michie, D. (1972). Machine intelligence at Edinburgh. Management Informatics, 2(1), 712.
Michie, D. (1974). Machine intelligence at Edinburgh. In On Intelligence, pp. 143155. Edinburgh University
Press.
Michie, d. and Chambers, r. A. (1968). BOXES: An experiment in adaptive control. In Dale, E. and Michie, D.
(Eds.), Machine Intelligence 2, pp. 125133. Elsevier/North-Holland, Amsterdam, London, New York.
Michie, d., Spiegelhalter, D. J., and Taylor, C. (Eds.). (1994). Machine Learning, Neural and Statistical
Classification. Ellis Horwood, Chichester, England.
Milgrom, P. (1997). Putting auction theory to work: The simultaneous ascending auction. Tech. rep. Technical
Report 980002, Stanford University Department of Economics.
Mill, J. S. (1843). A System of Logic, Ratiocinative and Inductive: Being a Connected View of the Principles of
Evidence, and Methods of Scientific Investigation. J. W. Parker, London.
Mill, J. S. (1863). Utilitarianism. Parker, Son and Bourn, London.
Miller, A. C., Merkhofer, M. M., Howard, R. A., Matheson, J. E., and Rice, T. R. (1976). Development of
automated aids for decision analysis. Technical report, SRI International, Menlo Park, California.
Minsky, M. L. (Ed.). (1968). Semantic Information Processing. MIT Press, Cambridge, Massachusetts.
Minsky, M. L. (1975). A framework for representing knowledge. In Winston, P. H. (Ed.), The Psychology of
Computer Vision, pp. 211277. McGraw-Hill, New York. Originally an MIT AI Laboratory memo; the 1975
version is abridged, but is the most widely cited.
Minsky, M. L. and Papert, S. (1969). Perceptrons: An Introduction to Computational Geometry (first edition).
MIT Press, Cambridge, Massachusetts.
Minsky, M. L. and Papert, S. (1988). Perceptrons: An Introduction to Computational Geometry (Expanded
edition). MIT Press, Cambridge, Massachusetts.
Minton, S. (1984). Constraint-based generalization: Learning game-playing plans from single expamples. In
Proceedings of the National Conference on Artificial Intelligence (AAAI-84), pp. 251254, Austin, Texas.
Morgan Kaufmann.
Minton, S. (1988). Quantitative results concerning the utility of explanation-based learning. In Proceedings of
the Seventh National Conference on Artificial Intelligence (AAAI-88), pp. 564569, St. Paul, Minnesota.
Morgan Kaufmann.
Minton, S., Johnston, M. D., Philips, A. B., and Laird, P. (1992). Minimizing conflicts: A heuristic repair
method for constraint satisfaction and scheduling problems. Artificial Intelligence, 58(13), 161205.
Mitchell, M. (1996). An Introduction to Genetic Algorithms. MIT Press, Cambridge, Massachusetts.
Mitchell, M., Holland, J. H., and Forrest, S. (1996). When will a genetic algorithm outperform hill climbing?. In
Cowan, J., Tesauro, G., and Alspector, J. (Eds.), Advances in Neural Information Processing Systems, Vol. 6.
MIT Press, Cambridge, Massachusetts.
913
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Mitchell, T. M. (1977). Version spaces: A candidate elimination approach to rule learning. In Proceedings of
the Fifth Intgernational Joint Conference on Artificial Intelligence (IJCAI-77), pp. 305310, Cambridge,
Massachusetts. IJCAII.
Mitchell, T. M. (1982). Generalization as search. Artificial Intelligence, 18(2), 203226.
Mitchell, t. M. (1990). Becoming increasingly reactive (mobile robots). In Proceedings of the Eighth National
Conference on Artificial Intelligence (AAAI-90), Vol. 2, pp. 10511058, Boston. MIT Press.
Mitchell, T. M. (1997). Machine Learning. McGraw-Hill, New York.
Mitchell, t. M., Keller, R., and Kedar-Cabelli, S. (1986). Explanation-based generalization: A unifying view.
Machine Learning, 1, 4780.
Mitchell, T. M., Utgoff, P. E., and Banerji, r. (1983). Learning by experimentation: Acquiring and refining
problem-solving heuristics. In Michalski, r. s., Carbonell, J. G., and Mitchell, T. M. (Eds.), Machine Learning:
An Artificial Intelligence Approach, pp. 163190. Morgan Kaufmann, San Mateo, California.
Mitkov, R. (2002). Anaphora Resolution. Longman, New York.
Mohr, R. and Henderson, T. C. (1986). Arc and path consistency revisited. Artificial Intelligence, 28(2), 225
233.
Mohri, M., Pereira, F., and Riley, M. (2002). Weighted finite-state transducers in speech recognition. Computer
Speech and Language, 16(1), 6988.
Montague, P. r., Dayan, P., Person, C., and Sejnowsky, T. (1995). Bee foraging in uncertain environments
using predictive Hebbian learning. Nature, 377, 725728.
Montague, R. (1970). English as a formal language. In Linguaggi nella Societ e nella Tecnica, pp. 189224.
Edizioni di Comunit, Milan.
Montague, r. (1973). The proper treatment of quantification in ordinary English. In Hintikka, K. J. J.,
Moravcsik, J. M. E., and Suppes, P. (Eds.), Approaches to Natural Language. D. Reidel, Dordrecht,
Netherlands.
Montanari, U. (1974). Networks of constraints: Fundamental properties and applications to picture processing.
Information Sciences, 7(2), 95132.
Montemerlo, M. Thrun, S., Koller, D., and Wegbreit, B. (2002). FastSLAM: A factored solution to the
simultaneous localization and mapping problem. In Preceedings of the Eighteenth National Conference on
Artificial Intelligence (AAAI-02), Edmonton, Alberta. AAAI Press.
Mooney, R. (1999). Learning for semantic interpretation: Scaling up without dumbing down. In Cussens, J.
(Ed.), Proceedings of the 1st Workshop on Learning Language in Logic, pp. 715. Springer-Verlag.
Mooney, R. J. and Califf, M. E. (1995). Induction of first-order decision lists: Results on learning the past tense
of English verbs. Journal of AI Research, 3, 124.
Moore, A. W. and Atkeson, C. G. (1993). Prioritized sweepingreinforcement learning with less data and less
time. Machine Learning, 13, 103130.
Moore, E. F. (1959). The shortest path through a maze. In Proceedings of an International Symposium on the
Theory orf Switching, Part II, pp. 285292. Harvard University Press, Cambridge, Massachusetts.
Moore, J. S. and Newell, A. (1973). How can Merlin understand?. In Gregg, L. (Ed.), Knowledge and
Cognition. Lawrence Erlbaum Associates, Potomac, Maryland.
Moore, R. C. (1980). Reasoning about knowledge and action. Artificial intelligence center technical note 191,
SRI Inernational, Menlo Park, California.
Moore, R. C. (1985). A formal theory of knowledge and action. In Hobbs, J. R. and Moore, R. C. (Eds.),
Formal Theories of the Commonsense World, pp. 319358. Ablex, Norwood, New Jersey.
914
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Moravec, H. P. (1983). The stanford cart and the cmu rover. Proceedings of the IEEE, 71(7), 872884.
Moravec, H., P. and Elfes, A. (1985). High resolution maps from wide angle sonar. In 1985 IEEE International
Conference on Robotics and Automation, pp. 116121, St. Louis, Missouri. IEEE Computer Society Press.
Moravec, H. P. (1988). Mind Children: The Future of Robot and Human Intelligence. Harvard Unviersity
Press, Cambridge, Massachusetts.
Moravec, H. P. (2000). Robot: Mere Machine to Transcendent Mind. Oxford University Press.
Morgenstern, L. (1987). Knowledge preconditions for actions and plans. In Proceedings of the Tenth
International Joint Conference on Artificial Intelligence (IJCAI-87), pp. 867874, Milan. Morgan Kaufmann.
Morgenstern, L. (1998). Inheritance comes of age: Applying nonmonotonic techniques to problems in industry.
Artificial Intelligence, 103, 237271.
Morjaria, M. A., Rink, F. J., Smith, W. D., Klempner, G., Burns, C., and Stein, J. (1995). Elicitation of
probabilities for belief networks: Combining qualitative and quantitative information. In Proceedings of the
Conference on Uncertainty in Artificial Intelligence, pp. 141148. Morgan Kaufmann.
Morrison, P. and Morrison, E. (Eds.). (1961). Charles Babbage and His Calculating Engines: Selected
Writings by Charles Babbage and Others. Dover, New York.
Moskewicz, M. W., Madigan, C. F., Zhao, Y., Zhang, L., and Malik, S. (2001). Chaff: Engineering an efficient
SAT solver. In Proceedings of the 38th Design Automation Conference (DAC 2001), pp. 530535. ACM Press.
Mosteller, F. and Wallace, D. L. (1964). Inference and Disputed Authorship: The Federalist. Addison-Wesley.
Mostow, J. and Prieditis, A. E. (1989). Discovering admissible heuristics by abstracting and optimizing: A
transformational approach. In Proceedings of the Eleventh International Joint Conference on Artificial
Intelligence (IJCAI-89), Vol. 1, pp. 701707, Detroit. Morgan Kaufmann.
Motzkin, T. S. and Schoenberg, I. J. (1954). The relaxation method for linear inequalities. Canadian Journal of
Mathematics, 6(3), 393404.
Moussouris, J., Holloway, J., and Greenblatt, R. D. (1979). CHEOPS: A chess-oriented processing system. In
Hayes, J. E., Michie, D., and Mikulich, L. I. (Eds.), Machine Intelligence 9, pp. 351360. Ellis Horwood,
Chichester, England.
Moutarlier, P. and Chatila, R. (1989). Stochastic multisensory data fusion for mobile robot location and
environment modeling. In 5th Int. Symposium on Robotics Research, Tokyo.
Muggleton, S. H. (1991). Inductive logic programming. New Generation Computing, 8, 295318.
Muggleton, s. H. (1992). Inductive Logic Programming. Academic Press, New York.
Muggleton, S. H. (1995). Inverse entailment and Progol. New Generation Computing, Special issue on
Inductive Logic Programming, 13(34), 245286.
Muggleton, S. H. (2000). Learning stochastic logic programs. Proceedings of the AAAI 2000 Workshop on
Learning Statistical Models from Relational Data.
Muggleton, S. H. and Buntine, W. (1988). Machine invention of first-order predicates by inverting resolution.
In Proceedings of the Fifth International Conference on Machine Learning, pp. 339352. Morgan Kaufmann.
Muggleton, S. H. and De Raedt, L. (1994). Inductive logic programming: Theory and methods. Journal of
Logic Programming, 19/20, 629679.
Muggleton, s. H. and Feng, C. (1990). Efficient induction of logic programs. In Proceedings of the Workshop
on Algorithmic Learning Theory, pp. 368381, Tokyo. Ohmsha.
Mller, M. (2002). Computer Go. Artificial Intelligence, 134(12), 145179.
915
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Mundy, J. and Zisserman, A. (Eds.). (1992). Geometric Invariance in Computer Vision. MIT Press, Cambridge,
Massachusetts.
Murphy, K., Weiss, Y., and Jordan, M. I. (1999). Loopy belief propagation for approximate inference: An
empirical study. In Uncertainty in Artificial Intelligence: Proceedings of the Fifteenth Conference, pp. 467475,
Stockholm. Morgan Kaufmann.
Murphy, K. and Russell, S. J. (2001). Raoblackwellised particle filtering for dynamic bayesian networks. In
Doucet, A., de Freitas, N., and Gordon, N. J. (Eds.), Sequential Monte Carlo Methods in Practice. SpringerVerlag, Berlin.
Murphy, R. (2000). Introduction to AI Robotics. MIT Press, Cambridge, Massachusetts.
Muscettola, N., Nayak, P., Pell, B., and Williams, B. (1998). Remote agent: To boldly go where no ai system
has gone before. Artificial Intelligence, 103, 548.
Myerson, r. B. (1991). Game Theory: Analysis of Conflict. Harvard University Press, Cambridge.
Nagel, t. (1974). What is it like to be a bat?. Philosophical Review, 83, 435450.
Nalwa, V. S. (1993). A Guided Tour of Computer Vision. Addison-Wesley, Reading, Massachusetts.
Nash, J. (1950). Equilibrium points in N-person games. Proceedings of the National Academy of Sciences of the
United States of America, 36, 4849.
Nau, D. S. (1980). Pathology on game trees: A summary of results. In Proceedings of the First Annual National
Conference on Artificial Intelligence (AAAI-80), pp. 102104, Stanford, California. AAAI.
Nau, d. S. (1983). Pathology on game trees revisited, and an alternative to minimaxing. Artificial Intelligence,
21(12), 221244.
Nau, D. S., Kumar, V., and Kanal, L. N. (1984). General branch and bound, and its relation to A* and AO*.
Artificial Intelligence, 23, 2958.
Naur, P. (1963). Revised report on the algorithmic language Algol 60. Communications of the Association for
Computing Machinery, 6 (1), 117.
Nayak, P. and Williams, B. (1997). Fast context switching in real-time propositional reasoning. In Proceedings
of the Fourteenth National Conference on Artificial Intelligence (AAAI-97), pp. 5056, Providence, Rhode
Island. AAAI Press.
Neal, R. (1996). Bayesian Learning for Neural Networks. Springer-Verlag, Berlin.
Nebel, B. (2000). On the compilability and expressive power of propositional planning formalisms. Journal of
AI Research, 12, 271315.
Nelson, G. and Oppen, D. C. (1979). Simplification by cooperating decision procedures. ACM Transactions on
Programming Languages and Systems, 1(2), 245257.
Netto, E. (1901). Lehrbuch der Combinatorik. b. G. Teubner, Leipzig.
Nevill-Manning, C. G. and Witten, I. H. (1997). Identifying hierarchical structures in sequences: A linear-time
algorithm. Journal of AI Research, 7, 6782.
Nevins, A. J. (1975). Plane geometry theorem proving using forward chaining. Artificial Intelligence, 6(1), 1
23.
Newell, a. (1982). The knowledge level. Artificial Intelligence, 18(1), 82127.
Newell, A. (1990). Unified Theories of Cognition. Harvard University Press, Cambridge, Massachusetts.
Newell, A. and Ernst, G. (1965). The search for generality. In Kalenich, W. A. (Ed.), Information Processing
1965: Proceedings of IFIP Congress 1965, Vol. 1, pp. 1724, Chicago. Spartan.
916
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Newell, A., Shaw, J. C., and Simon, H. A. (1957). Empirical explorations with the logic theory machine.
Proceedings of the Western Joint Computer Conference, 15, 218239. Reprinted in Feigenbaum and Feldman
(1963).
Newell, A., Shaw, J. C., and Simon, H. A. (1958). Chess playing programs and the problem of complexity. IBM
Journal of Research and Development, 4(2), 320335.
Newell, A. and Simon, H. a. (1961). GPS, a program that simulates human thought. In Billing, H. (Ed.),
Lernende Automaten, pp. 109124. R. Oldenbourg, Munich.
Newell, A. and Simon, H. A. (1972). Human Problem Solving. Prentice-Hall, Upper Saddle River, New Jersey.
Newell, A. and Simon, H. A. (1976). Computer science as empirical inquiry: Symbols and search.
Communications of the Association for Computing Machinery, 19, 113126.
Newton, I. (16641671). Methodus fluxionum et serierum infinitarum. Unpublished notes.
Ng, A. Y., Harada, D., and Russell, S. J. (1999). Policy invariance under reward transformations: Theory and
application to reward shaping. In Proceedings of the Sixteenth International Conference on Machine Learning,
Bled, Slovenia. Morgan Kaufmann.
Ng, A. Y. and Jordan, M. I. (2000). PEGASUS: A policy search method for large MDPs and POMDPs. In
Uncertainty in Artificial Intelligence: proceedings of the Sixteenth Conference, pp. 406415, Stanford,
California. Morgan Kaufmann.
Nguyen, X. and Kambhampati, S. (2001). Reviving partial order planning. In Proceedings of the Seventeenth
International Joint Conference on Artificial Intelligence (IJCAI-01), pp. 459466, Seattle. Morgan Kaufmann.
Nguyen, X. Kambhampati, S., and Nigenda, R. S. (2001). Planning graph as the basis for deriving heuristics for
plan synthesis by state space and CSP search. Tech. rep., Computer Science and Engineering Department,
Arizona State University.
Nicholson, A. and Brady, J. M. (1992). The data association problem when monitoring robot vehicles using
dynamic belief networks. In ECAI 92: 10th European Conference on Artificial Intelligence Proceedings, pp.
689693, Vienna, Austria. Wiley.
Niemel, I., Simons, P., and Syrjnen, T. (2000). Smodels: A system for answer set programming. In
Proceedings of the 8th International Workshop on Non-Monotonic Reasoning.
Nilsson, D. and Lauritzen, S. (2000). Evaluating influence diagrams using LIMIDs. In Uncertainty in Artificial
Intelligence: Proceedings of the Sixteenth Conference, pp. 436445, Stanford, California. Morgan Kaufmann.
Nilsson, N. J. (1965). Learning Machines: Foundations of Trainable Pattern-Classifying Systems. McGrawHill, New York. republished in 1990.
Nilsson, N. J. (1971). Problem-Solving Methods in Artificial Intelligence. McGraw-Hill, New York.
Nilsson, N. J. (1980). Principles of Artificial Intelligence. Morgan Kaufmann, San Mateo, California.
Nilsson, N. J. (1984). Shakey the robot. Technical note 323, SRI International, Menlo Park, California.
Nilsson, N. J. (1986). Probabilistic logic. Artificial Intelligence, 28(1), 7187.
Nilsson, N. J. (1991). Logic and artificial intelligence. Artificial Intelligence, 47(13), 3156.
Nilsson, N. J. (1998). Artificial Intelligence: A New Synthesis. Morgan Kaufmann, San Mateo, California.
Norvig, P. (1988). Multiple simultaneous interpretations of ambiguous sentences. In Proceedings of the 10th
Annual Conference of the Cognitive Science Society.
Norvig, P. (1992). Paradigms of Artificial Intelligence Programming: Case Studies in Common Lisp. Morgan
Kaufmann, San Mateo, California.
917
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Nowick, S. M., Dean, M. E., Dill, D. L., and Horowitz, M. (1993). The design of a high-performance cache
controller: A case study in asynchronous synthesis. Integration: The VLSI Journal, 15(3), 241262.
Nunberg, g. (1979). The non-uniqueness of semantic solutions: Polysemy. Language and Philosophy, 3(2)
143184.
Nussbaum, M. C. (1978). Aristotles De Motu Animalium. Princeton University Press, Princeton, New Jersey.
Ogawa, S., Lee, t.-M., Kay, A. R., and Tank, D. W. (1990). Brain magnetic resonance imaging with contrast
dependent on blood oxygenation. Proceedings of the National Academy of Sciences of the United States of
America, 87, 98689872.
Olawsky, D. and Gini, M. (1990). Deferred planning and sensor use. In Sycara, K. P. (Ed.), Proceedings,
DARPA Workshop on Innovative Approaches to Planning, Scheduling, and Control, San Diego, California.
Defense Advanced Research Projects Agency (DARPA), Morgan Kaufmann.
Olesen, K. G. (1993). Causal probabilistic networks with both discrete and continuous variables. IEEE
Transactions on Pattern Analysis and Machine Intelligence (PAMI), 15(3), 275279.
Oliver, r. M. and Smith, J. Q. (Eds.). (1990). Influence Diagrams, Belief Nets and Decision Analysis. Wiley,
New York.
Olson, C. F. (1994). Time and space efficient pose clustering. In Proceedings of the IEEE Conference on
Computer Vision and Pattern Recognition, pp. 251258, Washington, DC. IEEE Computer Society Press.
Oncina, J. and Garcia, P. (1992). Inferring regular languages in polynomial update time. In Perez, Sanfeliu, and
Vidal (Eds.), Pattern Recognition and Image Analysis, pp. 4961. World Scientific.
OReilly, U.-M. and Oppacher, f. (1994). Program search with a hierarchical variable length representation:
Genetic programming, simulated annealing and hill climbing. In Davidor, Y., Schwefel, H.-P., and Manner, R.
(Eds.), Proceedings of the Third Conference on Parallel Problem Solving from Nature, pp. 397406, Jerusalem,
Israel. Springer-Verlag.
Ormoneit, D. and Sen, S. (2002). Kernel-based reinforcement learning. Machine Learning, 49(23), 161178.
Ortony, A. (Ed.). (1979). Metaphor and Thought. Cambridge University Press, Cambridge, UK.
Osborne, M. J. and Rubinstein, A. (1994). A Course in Game Theory. MIT Press, Cambridge, Massachusetts.
Osherson, D. N., Stob, M., and Weinstein, S. (1986). Systems That Learn: An Introduction to Learning Theory
for Cognitive and Computer Scientists. MIT Press, Cambridge, Massachusetts.
Page, C. D. and Srinivasan, A. (2002). ILP: A short look back and a longer look forward. Submitted to Journal
of Machine Learning Research.
Pak, I. (2001). On mixing of certain random walks, cutoff phenomenon and sharp threshold of random matroid
processes. DAMATH: Discrete Applied Mathematics and Combinatorial Operations Research and Computer
Science, 110, 251272.
Palay, A. J. (1985). Searching with Probabilities. Pitman, London.
Palmer, D. A. and Hearst, M. A. (1994). Adaptive sentence boundary disambiguation. In Proceedings of the
Conference on Applied Natural Language Processing, pp. 7883. Morgan Kaufmann.
Palmer, S. (1999). Vision Science: Photons to Phenomenology. MIT Press, Cambridge, Massachusetts.
Papadimitriou, c. H. (1994). Computational Complexity. Addison-Wesley.
Papadimitriou, C. H., Tamaki, H., Raghavan, P., and Vempala, s. (1998). Latent semantic indexing: A
probabilistic analysis. In Proceedings of the ACM Conference on Principles of Database Systems (PODS), pp.
159168, New York. ACM Press.
918
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Papadimitriou, C. H. and Tsitsiklis, J. N. (1987). The complexity of markov decision processes. Mathematics
of Operations Research, 12(3), 441 450.
Papadimitriou, C. H. and Yannakakis, M. (1991). Shortest paths without a map. Theoretical Computer Science,
84(1), 127150.
Papavassiliou, V. and Russell, S. J. (1999). Convergence of reinforcement learning with general function
approximators. In Proceedings of the Sixteenth International Joint Conference on Artificial Intelligence (IJCAI99), pp. 748757, Stockholm. Morgan Kaufmann.
Parekh, R. and Honavar, V. (2001). Dfa learning from simple examples. Machine Learning, 44, 935.
Parisi, g. (1988). Statistical field theory. Addison-Wesley, Reading, Massachusetts.
Parker, D. B. (1985). Learning logic. Technical report TR-47, Center for Computational Research in
Economics and Management Science, Massachusetts Institute of Technology, Cambridge, Masachusetts.
Parker, L. E. (1996). On the design of behavior-based multi-robot teams. Journal of Advanced Robotics, 10(6).
Parr, R. and Russell, S. J. (1998). Reinforcement learning with hierarchies of machines. In Jordan, M. I.,
Kearns, M., and Solla, S. A. (Eds.), Advances in Neural Information Processing Systems 10. MIT Press,
Cambridge, Massachusetts.
Parzen, E. (1962). On estimation of a probability density function and mode. Annals of Mathematical Statistics,
33, 10651076.
Pasula, H. and Russell, S. J. (2001). Approximate inference for first-order probabilistic languages. In
Proceedings of the Seventeenth International Joint Conference on Artificial Intelligence (IJCAI-01), Seattle.
Morgan Kaufmann.
Pasula, H., Russell, S. J., Ostland, M., and Ritov, Y. (1999). Tracking many objects with many sensors. In
Proceedings of the Sixteenth International Joint Conference on Artificial Intelligence (IJCAI-99), Stockholm.
Morgan Kaufmann.
Paterson, M. S. and Wegman, M. N. (1978). Linear unification. Journal of Computer and System Sciences, 16,
158167.
Patrick, B. G., Almulla, M., and Newborn, M. M. (1992). An upper bound on the time complexity of iterativedeepening-A*. Annals of Mathematics and Artificial Intelligence, 5(24), 265278.
Patten, T. (1988). Systemic Text Generation as Problem Solving. Studies in Natural Language Processing.
Cambridge University Press, Cambridge, UK.
Paul, R. P. (1981). Robot Manipulators: Mathematics, Programming, and Control. MIT Press, Cambridge,
Massachusetts.
Peano, G. (1889). Arithmetices principia, nova methodo exposita. Fratres Bocca, Turin.
Pearl, J. (1982a). Reverend Bayes on inference engines: A distributed hierarchical approach. In Proceedings of
the National Conference on Artificial Intelligence (AAAI-82), pp. 133136, Pittsburgh, Pennsylvania. Morgan
Kaufmann.
Pearl, J. (1982b). The solution for the branching factor of the alphabeta pruning algorithm and its optimality.
Communications of the Association for Computing Machinery, 258), 559564.
Pearl, J. (1984). Heuristics: Intelligent Search Strategies for Computer Problem Solving. Addison-Wesley,
Reading, Massachusetts.
Pearl, J. (1986). Fusion, propagation, and structuring in belief networks. Artificial Intelligence, 29, 241288.
Pearl, J. (1987). Evidential reasoning using stochastic simulation of causal models. Artificial Intelligence, 32,
247257.
919
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Pearl, J. (1988). Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference. Morgan
Kaufmann, San Mateo, California.
Pearl, J. (2000). Causality: Models, Reasoning, and Inference. Cambridge University Press, Cambridge, UK.
Pearl, J. and Verma, T. (1991). A theory of inferred causation. In Allen, J. A., Fikes, R., and Sandewall, E.
(Eds.), Proceedings of the 2nd International Conference on Principles of Knowledge Representation and
Reasoning, pp. 441452, San Mateo, California. Morgan Kaufmann.
Pearson, J. and Jeavons, P. (1997). A survey of tractable constraint satisfaction problems. Technical report
CSD-TR-97-15, Royal Holloway College, U. of London.
Pednault, E. P. D. (1986). Formulating multiagent, dynamic-world problems in the classical planning
framework. In Georgeff, M. P. and Lansky, A. L. (Eds.), Reasoning about Actions and Plans: Proceedings of
the 1986 Workshop, pp. 4782, Timberline, Oregon. Morgan Kaufmann.
Peirce, C. S. (1870). Description of a notation for the logic of relatives, resulting from an amplification of the
conceptions of Booles calculus of logic. Memoirs of the American Academy of Arts and Sciences, 9, 317378.
Peirce, C. S. (1883). A theory of probable inference. Note B. The logic of relatives. In Studies in Logic by
Members of the Johns Hopkins University, pp. 187203, Boston.
Peirce, C. S. (1902). Logic as semiotic: The theory of signs. Unpublished manuscript; reprinted in (Buchler
1955).
Peirce, C. S. (1909). Existential graphs. Unpublished manuscript; reprinted in (Bucler 1955).
Pelikan, M., Goldberg, D. E., and Cantu-Paz, E. (1999). BOA: The Bayesian optimization algorithm. In
GECCO-99: Proceedings of the Genetic and Evolutionary Computation Conference, pp. 525532, Orlando,
Florida. Morgan Kaufmann.
Pemberton, J. C. and Korf, R. E. (1992). Incremental planning on graphs with cycles. In Hendler, J. (Ed.),
Artificial Intelligence Planning Systems: Proceedings of the First International Conference, pp. 525 532,
College Park, Maryland. Morgan Kaufmann.
Penberthy, J. S. and Weld, D. S. (1922). UCPOP: A sound, complete, partial order planner for ADL. In
Proceedings of KR-92, pp. 103114. Morgan Kaufmann.
Peng, J. and Williams, R. J. (1993). Efficient learning and planning within the Dyna framework. Adaptive
Behavior, 2, 437454.
Penrose, R. (1989). The Emperors New Mind. Oxford University Press, Oxford, UK.
Penrose, R. (1994). Shadows of the Mind. Oxford University Press, Oxford, UK.
Peot, M. and Smith, D. E. (1992). Conditional nonlinear planning. In Hendler, J. (Ed.), Proceedings of the First
International Conference on AI Planning Systems, pp. 189197, College Park, Maryland. Morgan Kaufmann.
Pereira, F. and Shieber, S. M. (1987). Prolog and Natural-Language Analysis. Center for the Study of
Language and Information (CSLI), Stanford, California.
Pereira, f. and Warren, D. H. D. (1980). Definite clause grammars for language analysis: A survey of the
formalism and a comparison with augmented transition networks. Artificial Intelligence, 13, 231278.
Peterson, C. and Anderson, J. R. (1987). A mean field theory learning algorithm for neural networks. Complex
Systems, 1(5) 9951019.
Pfeffer, A. (2000). Probabilistic Reasoning for Complex Systems. Ph.D. thesis, Stanford University, Stanford,
California.
Pinker, S. (1989). Learnability and Cognition. MIT Press, Cambridge, MA.
920
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Pinker, s. (1995). Language acquisition. In Gleitman, L. R., Liberman, M., and Osherson, D. N. (Eds.), An
Invitation to Cognitive Science (second edition)., Vol. 1. MIT Press, Cambridge Massachusetts.
Pinker, S. (2000). The Language Instinct: How the Mind Creates Language. MIT Press, Cambridge,
Massachusetts.
Plaat, A., Schaeffer, J., Pijls, W., and de Bruin, A. (1996). Best-first fixed-depth minimax algorithms. Artificial
Intelligence Journal, 87 (12), 255293.
Place, U. T. (1956). Is consciousness a brain process?. British Journal of Psychology, 47, 4450.
Plotkin, g. (1971). Automatic Methods of Inductive Inference. Ph.D. thesis, Edinburgh University.
Plotkin, G. (1972). Building-in equational theories. In Meltzer, B. and Michie, D. (Eds.), Machine Intelligence
7, pp. 7390. Edinburgh University Press, Edinburgh, Scotland.
Pnueli, A. (1977). The temporal logic of programs. In Proceedings of the 18th IEEE Symposium on the
Foundations of Computer Science (FOCS-77), pp. 4657, Providence, Rhode Island. IEEE, IEEE Computer
Society Press.
Pohl, I. (1969). Bi-directional and heuristic search in path problems. Tech. rep. 104, SLAC (Stanford Linear
Accelerator Center), Stanford, California.
Pohl, I. (1970). First results on the effect of error in heuristic search. In Meltzer, B. and Michie, D. (Eds.),
Machine Intelligence 5, pp. 219236. Elsevier/North-Holland, Amsterdam, London, New York.
Pohl, I. (1971). Bi-directional search. In Meltzer, B. and Michie, D. (Eds.), Machine Intelligence 6, p. 127140.
Edinburgh University Press, Edinburgh, Scotland.
Pohl, I. (1973). The avoidance of (relative) catastrophe, heuristic competence, genuine dynamic weighting and
computational issues in heuristic problem solving. In Proceedings of the Third International Joint Conference
on Artificial Intelligence (IJCAI-73), pp. 2023, Stanford, California. IJCAII.
Pohl, I. (1977). Practical and theoretical considerations in heuristic search algorithms. In Elcock, E. W. and
Michie, D. (Eds.), Machine Intelligence 8, pp. 5572. Ellis Horwood, Chichester, England.
Pomerleau, d. A. (1993). Neural Network Perception for Mobile Robot Guidance. Kluwer, Dordrecht,
Netherlands.
Ponte, J. M. and Croft, W. B. (1998). A language modeling approach to information retrieval. In Research and
Development in Information Retrieval, pp. 275281.
Poole, D. (1993). Probabilistic Horn abduction and Bayesian networks. Artificial Intelligence, 64, 81129.
Poole, D., Mackworth, A. K., and Goebel, R. (1998). Computational intelligence: A logical approach. Oxyford
University Press, Oxford, UK.
Popper, K. R. (1959). The Logic of Scientific Discovery. Basic Books, New York.
Popper, K. R. (1962). Conjectures and Refutations: The Growth of Scientific Knowledge. Basic Books, New
York.
Porter, M. F. (1980). An algorithm for suffix stripping. Program, 13(3), 130137.
Post, E. L. (1921). Introduction to a general theory of elementary propositions. American Journal of
Mathematics, 43, 163185.
Pradhan, M., Provan, G. M., Middleton, B., and Henrion, M. (1994). Knowledge engineering for large belief
networks. In Uncertainty in Artificial Intelligence: Proceedings of the Tenth Conference, pp. 484490, Seattle,
Washington, Morgan Kaufmann.
Pratt, V. R. (1976). Semantical considerations on Floyd-Hoare logic. In Proceedings of the 17th IEEE
Symposium on the Foundations of Computer Science, pp. 109121. IEEE Computer Society Press.
921
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Irodalomjegyzk
923
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Reiter, R. (2001a). On knowledge-based programming with sensing in the situation calculus. ACM
Transactions on Computational Logic, 2(4), 433 457.
Reiter, R. (2001b). Knowledge in Action: Logical Foundations for Specifying Implementing Dynamical
Systems. MIT Press, Cambridge, Massachusetts.
Reitman, W. and Wilcox, B. (1979). The structure and performance of the INTERIM.2 Go program. In
Proceedings of the Sixth International Joint Conference on Artificial Intelligence (IJCAI-79), pp. 711719,
Tokyo. IJCAII.
Remus, H. (1962). Simulation of a learning machine for playing Go. In Proceedings IFIP Congress, pp. 428
432, Amsterdam, London, New York. Elsevier/North-Holland.
Rnyi, A. )1970). Probability Theory. Elsevier/North-Holland, Amsterdam, London, New York.
Rescher, N. and Urquhart, A. (1971). Temporal Logic. Springer-Verlag, Berlin.
Reynolds, C. W. (1987). Flocks, herds, and schools: A distributed behavioral model. Computer Graphics, 21,
2534. SIGGRAPH 87 Conference Proceedings.
Rich, E. and Knight, K. (1991). Artificial Intelligence (second edition). McGraw-Hill, New York.
Richardson, M., Bilmes, J., and Diorio, C. (2000). Hidden-articulator Markov models: Performance
improvements and robustness to noise. In ICASSP-2000: 2000 International Conference on Acoustics, Speech,
and Signal Processing, Los Alamitos, CA. IEEE Computer Society Press.
Rieger, C. (1976). An organization of knowledge for problem solving and language comprehension. Artificial
Intelligence, 7, 89127.
Ringle, M. (1979). Philosophical Perspectives in Artificial Intelligence. Humanities Press, Atlantic Highlands,
New Jersey.
Rintanen, J. (1999). Improvements to the evaluation of quantified boolean formulae. In Proceedings of the
Sixteenth International Joint Conference on Artificial Intelligence (IJCAI-99), pp. 11921197, Stockholm.
Morgan Kaufmann.
Ripley, B. D. (1996). Pattern Recognition and Neural Networks. Cambridge University Press, Cambridge, UK.
Rissanen, J. (1984). Universal coding, information, prediction, and estimation. IEEE Transactions on
Information Theory, IT-30(4), 629636.
Ritchie, G. D. and Hanna, F. K. (1984). AM: A case study in AI methodology. Artificial Intelligence, 23(3),
249268.
Rivest, R. (1987). Learning decision lists. Machine Learning, 2(3), 229246.
Roberts, L. G. (1963). Machine perception of three-dimensional solids. Technical report 315, MIT Lincoln
Laboratory.
Robertson, N. and Seymour, P. D. (1986). Graph minors. ii. Algorithmic aspects of tree-width. Journal of
Algorithms, 7(3), 309322.
Robertson, S. E. (1977). The probability ranking principle in ir. Journal of Documentation, 33, 294304.
Robertson, S. E. and Sparck Jones, K. (1976). Relevance weighting of search terms. Journal of the American
Society for Information Science, 27, 129146.
Robinson, J. A. (1965). A machine-oriented logic based on the resolution principle. Journal of the Association
for Computing Machinery, 12, 2341.
Roche, E. and Schabes, Y. (1977). Finite-State Language Processing (Language, Speech and Communication).
Bradford Books, Cambridge.
924
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Irodalomjegyzk
Russell, S. J. (1986). A quantitative analysis of analogy by similarity. In Proceedings of the Fifth National
Conference on Artificial Intelligence (AAAI-86), pp. 284288, Philadelphia. Morgan Kaufmann.
Russell, S. J. (1988). Tree-structured bias. In Proceedings of the Seventh National Conference on Artificial
Intelligence (AAAI-88), Vol. 2. pp. 641645, St. Paul, Minnesota. Morgan Kaufmann.
Russell, S. J. (1992). Efficient memory-bounded search methods. In ECAI 92: 10th European Conference on
Artificial Intelligence Proceedings, pp. 15, Vienna. Wiley.
Russell, S. J. (1998). Learning agents for uncertain environments (extended abstract). In Proceedings of the
Eleventh Annual ACM Workshop on Computational Learning Theory (COLT-98), pp. 101103, Madison,
Wisconsin. ACM Press.
Russell, S. J., Binder, J., Koller, D., and Kanazawa, K. (1995). Local learning in probabilistic networks with
hidden variables. In Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence
(IJCAI-95), pp. 114652, Montreal. Morgan Kaufmann.
Russell, S. J. and Grosof, B. (1987). A declarative approach to bias in concept learning. In Proceedings of the
Sixth National Conference on Artificial Intelligence (AAAI-87), Seattle. Morgan Kaufmann.
Russell, S. J. and Norvig, P. (1995). Artificial Intelligence: A Modern Approach. Prentice-Hall, Upper Saddle
River, New Jersey.
Russell, S. J. and Subramanian, D. (1995). Provably bounded-optimal agents. Journal of Artificial Intelligence
Research, 3, 575609.
Russell, S. J., Subramanian, D., and Parr, R. (1993). Provably bounded optimal agents. In Proceedings of the
Thirteenth International Joint Conference on Artificial Intelligence (IJCAI-93), pp. 338345, Chambery,
France. Morgan Kaufmann.
Russell, S. J. and Wefald, E. H. (1989). On optimal game-tree search using rational meta-reasoning. In
Proceedings of the Eleventh International Joint Conference on Artificial Intelligence (IJCAI-89), pp. 334340,
Detroit. Morgan Kaufmann.
Russell, S. J. and Wefald, E. H. (1991). Do the Right Thing: Studies in Limited Rationality. MIT Press,
Cambridge, Massachusetts.
Rustagi, J. S. (1976). Variational Methods in Statistics. Academic Press, New York.
Ryder, J. L. (1971). Heuristic analysis of large trees as generated in the game of Go. Memo AIM-155, Stanford
Artificial Intelligence Project, Computer Science Department, Stanford University, Stanford, California.
Sabin, D. and Freuder, E. C. (1994). Contradicting conventional wisdom in constraint satisfaction. In ECAI 94:
11th European Conference on Artificial Intelligence. Proceedings, pp. 125129, Amsterdam. Wiley.
Sacerdoti, E. D. (1974). Planning in a hieararchy of abstraction spaces. Artificial Intelligence, 5(2), 115135.
Sacerdoti, E. D. (1975). The nonlinear nature of plans. In Proceedings of the Fourth International Joint
Conference on Artificial Intelligence (IJCAI-75), pp. 206214, Tbilisi, Georgia. IJCAII.
Sacerdoti, E. D. (1977). A Structure for Plans and Behavior. Elsevier/North-Holland, Amsterdam, London,
New York.
Sacerdoti, E. D., Fikes, R. E., Reboh, R., Sagalowicz, D., Waldinger, R., and Wilber, B. M. (1976). QLISP a
language for the interactive development of complex systems. In Proceedings of the AFIPS National Computer
Conference, pp. 349356.
Sacks, E. and Joskowicz, L. (1993). Automated modeling and kinematic simulation of mechanisms. Computer
Aided Design, 25(2), 106118.
Sadri, F. and Kowalski, R. (1995). Variants of the event calculus. In International Conference on Logic
Programming, pp. 6781.
926
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Sag, I. and Wasow, T. (1999). Syntactic Theory: An Introduction. CSLI Publications, Stanford, California.
Sager, N. (1981). Natural Language Information Processing: A Computer Grammar of English and 1st
Applications. Addison-Wesley, Reading, Massachusetts.
Sahami, M., Dumais, S. T., Heckerman, D., and Horvitz, E. J. (1998). A Bayesian approach to filtering junk Email. In Learning for Text Categorization: Papers from the 1998 Workshop, Madison, Wisconsin. AAAI
Technical Report WS-98-05.
Sahami, M., Hearst, M. A., and Saund, E. (1996). Applying the multiple cause mixture model to text
categorization. In Saitta, L. (Ed.), Proceedings of ICML-96, 13th International Conference on Machine
Learning, pp. 435443, Bari, Italy. Morgan Kaufmann Publishers.
Salomaa, A. (1969). Probabilistic and weighted grammars. Information and Control, 15, 529 544.
Salton, G. and McGill, M. J. (1983). Introduction to Modern Information Retrieval. McGraw-Hill, New York,
NY.
Salton, G., Wong, A., and Yang, C. S. (1975). A vector space model for automatic indexing. Communications
of the ACM, 18(11), 613620.
Samuel, A. L. (1959). Some studies in machine learning using the game of checkers. IBM Journal of Research
and Development, 3(3), 210229.
Samuel, A. L. (1967). Some studies in machine learning using the game of checkers II Recent progress. IBM
Journal of Research and Development, 11(6), 601617.
Samuelsson, C. and Rayner, M. (1991). Quantitative evaluation of explanation-based learning as an
optimization tool for a large-scale natural language system. In Proceedings of the Twelfth International Joint
Conference on Artificial Intelligence (IJCAI-91), pp. 609615, Sydney. Morgan Kaufmann.
Sato, T. and Kameya, Y. (1997). PRISM: A symbolic-statistical modeling language. In Proceedings of the
Fifteenth International Joint Conference on Artificial Intelligence (IJCAI-97), pp. 13301335, Nagoya, Japan.
Morgan Kaufmann.
Saul, L. K., Jaakkola, T., and Jordan, M. I. (1996). Mean field theory for sigmoid belief networks. Journal of
Artificial Intelligence Research, 4, 6176.
Savage, L. J. (1954). The Foundations of Statistics. Wiley, New York.
Sayere, K. (1993). Three more flaws in the computation model. Paper presented at the APA (Central Division)
Annual Conference, Chicago, Illinois.
Schabes, Y., Abeille, A., and Joshi, A. K. (1988). Parsing strategies with lexicalized grammars: Application to
tree adjoining grammars. In Vargha, D. (Ed.), Proceedings of the 12th International Conference on
Computational Linguistics (COLING), Vol. 2, pp. 578583, Budapest, John von Neumann Society for
Computer Science.
Schaeffer, J. (1997). One Jump Ahead: Challenging Human Supremacy in Checkers. Springer-Verlag, Berlin.
Schank, R. C. and Abelson, R. P. (1977). Scripts, Plans, Goals, and Understanding. Lawrence Erlbaum
Associates, Potomac, Maryland.
Schank, R. C. and Riesbeck, C. (1981). Inside Computer Understanding: Five Programs Plus Miniatures.
Lawrence Erlbaum Associates, Potomac, Maryland.
Schapire, R. E. (1999). Theoretical views of boosting and applications. In Algorithmic Learning Theory:
Proceedings of the 10th International Conference (ALT99), pp. 1325. Springer-Verlag, Berlin.
Schapire, R. E. (1990). The strength of weak learnability. Machine Learning, 5(2), 197227.
927
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Schmolze, J. G. and Lipkis, T. A. (1983). Classification in the KL-ONE representation system. In Proceedings
of the Eighth International Joint Conference on Artificial Intelligence (IJCAI-83), pp. 330332, Karlsruhe,
Germany. Morgan Kaufmann.
Schofield, P. D. A. (1967). Complete solution of the eight puzzle. In Dale, E. and Michie, D. (Eds.), Machine
Intelligence 2, pp. 125133. Elsevier/North-Holland, Amsterdam, London, New York.
Schlkopf, B. and Smola, A. J. (2002). Learning with Kernels. MIT Press, Cambridge, Massachusetts.
Schning, T. (1999). A probabilistic algorithm for k-SAT and constraint satisfaction problems. In 40th Annual
Symposium on Foundations of Computer Science, pp. 410414, New York. IEEE Computer Society Press.
Schoppers, M. J. (1987). Universal plans for reactive robots in unpredictable environments. In Proceedings of
the Tenth International Joint Conference on Artificial Intelligence (IJCAI-87), pp. 1039 1046, Milan. Morgan
Kaufmann.
Schoppers, M. J. (1989). In defense of reaction plans as caches. AI Magazine, 10(4), 5160.
Schrder, E. (1877). Der Operationskreis des Logikkalkls. B. G. Teubner, Leipzig.
Schultz, W., Dayan, P., and Montague, P. R. (1997). A neural substrate of prediction and reward. Science, 275,
1593.
Schtze, H. (1995). Ambiguity in Language Learning: Computational and Cognitive Models. Ph.D. thesis,
Stanford University. Also published by CSLI Press, 1997.
Schwartz, J. T. Scharir, M., and Hopcroft, J. (1987). Planning, Geometry and Complexity of Robot Motion.
Ablex Publishing Corporation, Norwood, NJ.
Schwartz, S. P. (Ed.). (1977). Naming, Necessity, and Natural Kinds. Cornell University Press, Ithaca, New
York.
Scott, D. and Krauss, P. (1966). Assigning probabilities to logical formulas. In Hintikka, J. and Suppes, P.
(Eds.), Aspects of Inductive Logic: North-Holland, Amsterdam.
Scriven, M. (1953). The mechanical concept of mind. Mind, 62, 230240.
Searle, J. R. (1969). Speech Acts: An Essay in the Philosophy of Language. Cambridge University Press,
Cambridge, UK.
Searle, J. R. (1980). Minds, brains, and programs. Behavior and Brain Sciences, 3, 417457.
Searle, J. R. (1984). Minds, Brains and Science. Harvard University Press, Cambridge, Massachusetts.
Searle, J. R. (1990). Is the brains mind a computer program?. Scientific American, 262, 2631.
Searle, J. R. (1992). The Rediscovery of the Mind. MIT Press, Cambridge, Massachusetts.
Selman, B., Kautz, H., and Cohen, B. (1996). Local search strategies for satisfiability testing. In DIMACS
Series in Discrete Mathematics and Theoretical Computer Science, Volume 26, pp. 521532. American
Mathematical Society, Providence, Rhode Island.
Selman, B. and Levesque, H. J. (1993). The complexity of path-based defeasible inheritance. Artificial
Intelligence, 62(2), 303339.
Selman, B. Levesque, H. J., and Mitchell, D. (1992). A new method for solving hard satisfiability problems. In
Proceedings of the Tenth National Conference on Artificial Intelligence (AAAI-92), pp. 440446, San Jose.
AAAI Press.
Shachter, R. D. (1986). Evaluating influence diagrams. Operations Research, 34, 871882.
928
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Shachter, R. D. (1998). Bayes-ball: The rational pastime (for determining irrelevance and requisite information
in belief networks and influence diagrams). In Uncertainty in Artificial Intelligence: Proceedings of the
Fourtheenth Conference, pp. 480487, Madison, Wisconsin. Morgan Kaufmann.
Shachter, R. D., DAmbrosio, B., and Del Favero, B. A. (1990). Symbolic probabilistic inference in belief
networks. In Proceedings of the Eighth National Conference on Artificial Intelligence (AAAI-90), pp. 126131,
Boston, MIT Press.
Shachter, R. D. and Kenley, C. R. (1989). Gaussian influence diagrams. Management Science, 35(5), 527550.
Shachter, R. D. and Peot, M. (1989). Simulation approaches to general probabilistic inference on belief
networks. In Proceedings of the Fifth Conference on Uncertainty in Artificial Intelligence (UAI-89), Windsor,
Ontario, Morgan Kaufmann.
Shafer, G. (1976). A Mathematical Theory of Evidence. Princeton University Press, Princeton, New Jersey.
Shafer, G. and Pearl, J. (Eds.). (1990). Readings in Uncertain Reasoning. Morgan Kaufmann, San Mateo,
California.
Shahookar, K. and Mazumder, P. (1991). VLSI cell placement techniques. Computing Surveys, 23(2), 143
220.
Shanahan, M. (1997). Solving the Frame Pproblem. MIT Press, Cambridge, Massachusetts.
Shanahan, M. (1999). The event calculus explained. In Wooldridge, M. J. and Veloso, M. (Eds.), Artificial
Intelligence Today, pp. 409430. Springer-Verlag, Berlin.
Shankar, N. (1986). Proof-Checking Metamathematics. Ph.D. thesis, Computer Science Department,
University of Texas at Austin.
Shannon, C. E. and Weaver, W. (1949). The Mathematical Theory of Communication. University of Illinois
Press, Urbana, Illinois.
Shannon, C. E. (1950). Programming a computer for playing chess. Philosophical Magazine, 41(4), 256275.
Shapiro, E. (1981). An algorithm that infers theories from facts. In Proceedings of the Seventh International
Joint Conference on Artificial Intelligence (IJCAI-81), p. 1064, Vancouver, British Columbia. Morgan
Kaufmann.
Shapiro, S. C. (Ed.). (1992). Encyclopedia of Artificial Intelligence (second edition). Wiley, New York.
Shapley, S. (1953). Stochastic games. In Proceedings of the National Academy of Sciences, Vol. 39, pp. 1095
1100.
Shavlik, J. and Dietterich, T. (Eds.). (1990). Readings in Machine Learning. Morgan Kaufmann, San Mateo,
California.
Shelley, M. (1818). Frankenstein: or, the Modern Prometheus. Pickering and Chatto.
Shenoy, P. P. (1989). A valuation-based language for expert systems. International Journal of Approximate
Reasoning, 3(5), 383411.
Shi, J. and Malik, J. (2000). Normalized cuts and image segmentation. IEEE Transactions on Pattern Analysis
and Machine Intelligence (PAMI), 22(8), 888905.
Shoham, Y. (1987). Temporal logics in AI: Semantical and ontological considerations. Artificial Intelligence,
33(1), 89104.
Shoham, Y. (1993). Agent-oriented programming. Artificial Intelligence, 60(1), 5192.
Shoham, Y. (1994). Artificial Intelligence Techniques in Prolog. Morgan Kaufmann, San Mateo, California.
929
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Irodalomjegyzk
Slate, D. J. and Atkin, L. R. (1977). CHESS 4.5 Northwestern University chess program. In Frey, P. W. (Ed.),
Chess Skill in Man and Machine, pp. 82118. Springer-Verlag, Berlin.
Slater, E. (1950). Statistics for the chess computer and the factor of mobility. In Symposiumon Information
Theory, pp. 150152, London,. Ministry of Supply.
Sleator, D. and Temperley, D. (1993). Parsing English with a link grammar. In Third Annual Workshop on
Parsing technologies.
Sloman, A. (1978). The Computer Revolution in Philosophy. Harvester Press, Hassocks, Sussex, UK.
Smallwood, R. D. and Sondik, E. J. (1973). The optimal control of partially observable Markov processes over
a finite horizon. Operations Research, 21, 10711088.
Smith, D. E., Genesereth, M. R., and Ginsberg, M. L. (1986). Controlling recursive inference. Artificial
Intelligence, 30(3), 343389.
Smith, D. R. (1990). KIDS: a semiautomatic program development system. IEEE Transactions on Software
Engineering, 16(9), 10241043.
Smith, D. R. (1996). Machine suppurt for software development. In Proceedings of the 18th International
Conference on Software Engineering, pp. 167168, Berlin. IEEE Computer Society Press.
Smith, D. E. and Weld, D. S. (1998). Conformant Graphplan. In Proceedings of the Fifteenth National
Conference on Artificial Intelligence (AAAI-98), pp. 889896, Madison, Wisconsin. AAAI Press.
Smith, J. Q. (1988). Decision Analysis. Chapman and Hall, London.
Smith, J. M. and Szathmry, E. (1999). The Origins of Life: From the Birth of Life to the Origin of Language.
Oxford University Press, Oxford, UK.
Smith, R. C. and Cheeseman, P.(1986). On the representation and estimation of spatial uncertainty.
International Journal of Robotics Research, 5(4), 5668.
Smith, S. J. J., Nau, D. S., and Throop, T. A. (1998). Success in spades: Using ai planning techniques to win the
world championship of computer bridge. In Proceedings of the Fifteenth National Conference on Artificial
Intelligence (AAAI-98), pp. 10791086, Madison, Wisconsin. AAAI Press.
Smolensky, P. (1988). On the proper treatment of connectionism. Behavioral and Brain Sciences, 2, 174.
Smyth, P. Heckerman, D., and Jordan, M. I. (1997). Probabilistic independence networks for hidden Markov
probability models. Neural Computation, 9(2), 227269.
Soderland, S. and Weld, D. S. (1991). Evaluating nonlinear planning. Technical report TR-91-02-03,
University of Washington Department of Computer Science and Engineering, Seattle, Washington.
Solomonoff, R. J. (1964). A formal theory of inductive inference. Information and Control, 7, 122, 224254.
Sondik, E. J. (1971). The Optimal Control of Partially Observable Markov Decision Processes. Ph.D. thesis,
Stanford University, Stanford, California.
Sosic, r. and Gu, J. (1994). Efficient local search with conflict minimalization: A case study of the n-queens
problem. IEEE Transactions on Knowledge and Data Engineering, 6(5), 661668.
Sowa, J. (1999). Knowledge Representation: Logical, Philosophical and Computational Foundations.
Blackwell, Oxford, UK.
Spiegelhalter, D. J. (1986). Probabilistic reasoning in predictive expert systems. In Kanal, L. N. and Lemmer, J.
F. (Eds.), Uncertainty in Artificial Intelligence, pp. 4767. Elsevier/North-Holland, Amsterdam, London, New
York.
Spiegelhalter, D. J. Dawid, P., Lauritzen, S., and Cowell, R. (1993). Bayesian analysis in expert systems.
Statistical Science, 8, 219282.
931
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
932
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Sugihara, K. (1984). A necessary and sufficient condition for a picture to represent a polyhedral scene. IEEE
Transactions on Pattern Analysis and Machine Intelligence (PAMI), 6(5), 578586.
Sussman, G. J. (1975). A Computer Model of Skill Acquisition. Elsevier/North-Holland, Amsterdam, London,
New York.
Sussman, G. J. and Winograd, T. (1970). MICROPLANNER Reference Manual. Ai memo 203, MIT AI Lab,
Cambridge, Massachusetts.
Sutherland, I. (1963). Sketchpad: A man-machine graphical communication system. In Proceedings of the
Spring Joint Computer Conference, pp. 329346. IFIPS.
Sutton, R. S. (1988). Learning to predict by the methods of temporal differences. Machine Learning, 3, 944.
Sutton, R. S., McAllester, D. A., Singh, S. P., and Mansour, Y. (2000). Policy gradient methods for
reinforcement learning with function approximation. In Solla, S. A., Leen, T. K., and Mller, K.-R. (Eds.),
Advances in Neural Information Processing Systems 12, pp. 10571063. MIT Press, Cambridge, Massachusetts.
Sutton, R. S. (1990). Integrated architectures for learning, planning, and reacting based on approximating
dynamic programming. In Machine Learning: Proceedings of the Seventh International Conference, pp. 216
224, Austin, Texas. Morgan Kaufmann.
Sutton, R. S. and Barto, A. G. (1998). Reinforcement Learning: An Introduction. MIT Press, Cambridge,
Massachusetts.
Swade, D. D. (1993). Redeeming Charles Babbages mechanical computer. Scientific American, 268(2), 8691.
Swerling, P. (1959). First order error propagation in a stagewise smoothing procedure for satellite observations.
Journal of Astronautical Sciences, 6, 4652.
Swift, T. and Warren, D. S. (1994). Analysis of SLG-WAM evaluation of definite programs. In Logic
Programming. Proceedings of the 1994 International Symposium, pp. 219235, Ithaca NY. MIT Press.
Syrjnen, T. (2000). Lparse 1.0 users manual http://saturn.tcs.hut.fi/Software/smodels.
Tadepalli, P. (1993). Learning from queries and examples with tree-structured bias. In Proceedings of the Tenth
International Conference on Machine Learning, pp. 322329, Amherst, Massachusetts. Morgan Kaufmann.
Tait, P. G. (1880). Note on the theory of the 15 puzle. Proceedings of the Royal Society of Edinburgh, 10,
664665.
Tamaki, H. and Sato, T. (1986). OLD resolution with tabulation. In Third International Conference on Logic
Programming, pp. 8498, London, Springer-Verlag.
Tambe, M., Newell, A., and Rosenbloom, P. S. (1990). The problem of expensive chunks and its solution by
restricting expressiveness. Machine Learning, 5, 299348.
Tarjan, R. E. (1983). Data Structures and Network Algorithms. CBMS-NSF Regional Conference Series im
Applied Mathematics. SIAM (Society for Industrial and Applied Mathematics, Philadelphia.
Tarski, A. (1935). Die Wahrheitsbegriff in den formalisierten Sprachen. Studia Philosophica, 1, 261405.
Tarski, A. (1956). Logic, Semantics, Metamathematics: Papers from 1923 to 1938. Oxford University Press,
Oxford, UK.
Tash, J. K. and Russell, S. J. (1994). Control strategies for a stochastic planner. In Proceedings of the Twelfth
National Conference on Artificial Intelligence (AAAI-94), pp. 10791085, Seattle. AAAI Press.
Tate, A. (1975a). Interacting goals and their use. In Proceedings of the Fourth International Joint Conference
on Artificial Intelligence (IJCAI-75), pp. 215218, Tbilisi, Georgia. IJCAII.
Tate, A. (1975b). Using Goal Structure to Direct Search in a Problem Solver, Ph.D. thesis, University of
Edinburgh, Edinburgh, Scotland.
933
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Tate, A. (1977). Generating project networks. In Proceedings of the Fifth International Joint Conference on
Artificial Intelligence (IJCAI-77), pp. 888893, Cambridge, Massachusetts. IJCAII.
Tate, A. and Whiter, A. M. (1984). Planning with multiple resource constraints and an application to a naval
planning problem. In Proceedings of the First Conference on AI Applications, pp. 410416, Denver, Colorado.
Tatman, J. A. and Shachter, R. D. (1990). Dynamic programming and influence diagrams. IEEE Transactions
on Systems, Man and Cybernetics, 20(2), 365379.
Tesauro, G. (1989). Neurogammon wins computer olympiad. Neural Computation, 1(3), 321323.
Tesauro, G. (1992). Practical issues in temporal difference learning. Machine Learning, 8(34), 257277.
Tesauro, G. (1995). Temporal difference learning and TD-Gammon. Communications of the Association for
Computing Machinery, 38(3), 5868.
Tesauro, G. and Sejnowski, T. (1989). A parallel network that learns to play backgammon. Artificial
Intelligence, 39(3) 357390.
Thagard, P. (1996). Mind: Introduction to Cognitive Science. MIT Press, Cambridge, Massachusetts.
Thaler, R. (1992). The Winners Curse: Paradoxes and Anomalies of Economic Life. Princeton University
Press, Princeton, New Jersey.
Thielscher, M. (1999). From situation calculus to fluent calculus: State update axioms as a solution to the
inferential frame problem. Artificial Intelligence, 111(12), 277299.
Thomason, R. H. (Ed.). (1974). Formal Philosophy: Selected Papers of Richard Montague. Yale University
Press, New Haven, Connecticut.
Thompson, D. W. (1917). On Growth and Form. Cambridge University Press, Cambridge, UK.
Thrun, S. (2000). Towards programming tools for robots that integrate probabilistic computation and learning.
In Proceedings of the IEEE International Conference on Robotics and Automation (ICRA), San Francisco, CA.
IEEE.
Thrun, S. (2002). Robotic mapping: A survey. In Lakemeyer, G. and Nebel, B. (Eds.), Exploring Artificial
Intelligence in the New Millenium. Morgan Kaufmann. to appear.
Titterington, D. M., Smith, A. F. M., and Makov, U. E. (1985). Statistical analysis of finite mixture
dictributions. Wiley, New York.
Toffler, A. (1970). Future Shock. Bantam.
Tomasi, C. and Kanade, T. (1992). Shape and motion from image streams under orthography: A factorization
method. International Journal of Computer Vision, 9, 137154.
Touretzky, D. S. (1986). The Mathematics of Inheritance Systems. Pitman and Morgan Kaufmann, London and
San Mateo, California.
Trucco, E. and Verri, A. (1998). Introductory Techniques for 3-D Computer Vision. Prentice Hall, Upper
Saddle River, New Jersey.
Tsang, E. (1993). Foundations of Constraint Satisfaction. Academic Press, New York.
Tsitsiklis, J. N. and Van Roy, B. (1997). An analysis of temporal-difference learning with function
approximation. IEEE Transactions on Automatic Control, 42(5), 674690.
Tumer, K. and Wolpert, D. (2000). Collective intelligence and braess paradox. In Proceedings of the
AAAI/IAAI, pp. 104109.
Turcotte, M., Muggleton, S. H., and Sternberg, M. J. E. (2001). Automated discovery of structural signatures of
protein fold and function. Journal of Molecular Biology, 306, 591605.
934
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
935
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Veloso, M. and Carbonell, J. G. (1993). Derivational analogy in prodigy: Automating case acquisition, storage,
and utilization. Machine Learning, 10, 249278.
Vere, S. A. (1983). Planning in time: Windows and durations for activities and goals. IEEE Transactions on
Pattern Analysis and Machine Intelligence (PAMI), 5, 246267.
Vinge, V. (1993). The coming technological singularity: How to survive in the post-human era. In VISION-21
Symposium. NASA Lewis Research Center and the Ohio Aerospace Institute.
Viola, P. and Jones, M. (2002). Robust real-time object detection. International Journal of Computer Vision, in
press.
von Mises, R. (1928). Wahrscheinlichkeit, Statistik und Wahrheit. J. Springer, Berlin.
von Neumann, J. (1928). Zur Theorie der Gesellschaftsspiele. Mathematische Annalen, 100(295 320).
von Neumann, J. and Morgenstern, O. (1944). Theory of Games and Economic Behavior (first edition).
Princeton University Press, Princeton, New Jersey.
von Winterfeldt, D. and Edwards, W. (1986). Desicion Analysis and Behavioral Research. Chambridge
University Press, Cambridge, UK.
Voorhees, E. M. (1993). Using WordNet to disambiguate word sens for text retrieval. In Sixteenth Annual
International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 17180,
Pittsburgh. Association for Computing Machinery.
Vossen, T., Ball, M., Lotem, A., and Nau, D. S. (2001). Applying integer programming to ai planning.
Knowledge Engieneering Review, 16, 85100.
Waibel, A. and Lee, K.-F., (1990). Readings in Speech Recognition. Morgan Kaufmann, San Mateo, California.
Waldinger, R. (1975). Achieving several goals simultaneously. In Elcock, E. W. and Michie, D. (Eds.),
Machine Intelligence 8, pp. 94138. Ellis Horwood, Chichester, England.
Waltz, D. (1975). Understanding line drawings of scenes with shadows. In Winston, P. H. (Ed.), the Psychology
of Computer Vision. McGraw-Hill, New York.
Wanner, E. (1974). On remembering, forgetting and understanding sentences. Mouton, The Hague and Paris.
Warren, D. H. D. (1974). WARPLAN: A System for Generating Plans. Department of Computational Logic
Memo 76, University of Edinburgh, Edinburgh, Scotland.
Warren, D. H. D. (1976). Generating conditional plans and programs. In Proceedings of the AISB Summer
Conference, pp. 344354.
Warren, D. H. D. (1983). An abstract Prolog instruction set. Technical note 309, SRI International, Menlo Park,
California.
Warren, D. H. D., Pereira, L. M., and Pereira, F. (1977). PROLOG: The language and its implementation
compared with LISP. SIGPLAN Notices, 12(8), 109115.
Watkins, C. J. (1989). Models of Delayed Reinforcement Learning. Ph.D. thesis, Psychology Department,
Cambridge University, Cambridge, UK.
Watson, J. D. and Crick, F. H. C. (1953). A structure for deoxyribose nucleic acid. Nature, 171, 737.
Webber, B. L. (1983). So what can we talk about now? In Brady, M. and Berwick, R. (Eds.), Computational
Models of Discourse. MIT Press, Cambridge, Massachusetts.
Webber, B. L. (1988). Tense as discourse anaphora. Computational Linguistics, 14(2), 6173.
Webber, B. L. and Nilsson, N. J. (Eds.). (1981). Readings in Artificial Intelligence. Morgan Kaufmann, San
Mateo, California.
936
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Weidenbach, C. (2001). SPASS: Combining superposition, sorts and splitting. In Robinson, A. and Voronkov,
A. (Eds.), Handbook of Automated Reasoning. mit, mit-ad.
Weiss, G. (1999). Multiagent systems. MIT Press, Cambridge, Massachusetts.
Weiss, S. and Kulikowski, C. A. (1991). Computer Systems That Learn: Classification and Prediction Methods
from Statistics, Neural Nets, Machine Learning, and Expert Systems. Morgan Kaufmann, San Mateo, California.
Weizenbaum, J. (1976). Computer Power and Human Reason. W. H. Freeman, New York.
Weld, D. S. (1994). An introduction to least commitment planning. AI Magazine, 15(4), 2761.
Weld, D. S. (1999). Recent advances in ai planning. AI Magazine, 20(2) 93122.
Weld, D. S. Anderson, C. R., and Smith, D. E. (1998). Extending graphplan to handle uncertainty and sensing
actions. In Proceedings of the Fifteenth National Conference on Artificial Intelligence (AAAI-98), pp. 897904,
Madison, Wisconsin. AAAI Press.
Weld, D. S. and de Kleer, J. (1990). Readings in Qualitative Reasoning about Physical Systems. Morgan
Kaufmann, San Mateo, California.
Weld, D. S. and Etzioni, O. 1994). The first law of robotics: A call to arms. In Proceedings of the Twelfth
National Conference on Artificial Intelligence (AAAI-94), Seattle. AAAI Press.
Wellman, M. P. (1985). Reasoning about preference models. Technical report MIT/LCS/TR-340, Laboratory
for Computer Science, MIT, Cambridge, Massachusetts.
Wellman, M. P. (1988). Formulation of Tradeoffs in Planning under Uncertainty. Ph.D. thesis, Massachusetts
Institute of Technology, Cambridge, Massachusetts.
Wellman, M. P. (1990a). Fundamental concepts of qualitative probabilistic networks. Artificial Intelligence,
44(3), 257303.
Wellman, M. P. (1990b). The STRIPS assumption for planning under uncertainty. In Proceedings of the Eighth
National Conference on Artificial Intelligence (AAAI-90), pp. 198203, Boston. MIT Press.
Wellman, M. P. (1995). The economic approach to artificial intelligence. ACM Computing Surveys, 27(3), 360
362.
Wellman, M. P., Breese, J. S., and Goldman, R. (1992). From knowledge bases to decision models. Knowledge
Engieneering Review, 7(1), 3553.
Wellman, M. P. and Doyle, J. (1992). Modular utility representation for decision-theoretic planning. In
Proceedings, First International Conference on AI Planning Systems, pp. 236242, College Park, Maryland.
Morgan Kaufmann.
Werbos, P. (1974). Beyond Regression: New Tools for Prediction and Analysis in the Behavioral Sciences.
Ph.D. thesis, Harvard University, Cambridge, Massachusetts.
Werbos, P. (1977). Advanced forecasting methods for global crisis warning and models of intelligence. General
Systems Yearbook, 22, 2538.
Wesley, M. A. and Lozano-Perez, T. (1979). An algorithm for planning collision-free paths among polyhedral
objects. Communications of the ACM, 22(10), 560570.
Wheatstone, C. (1838). On some remarkable, and hitherto unresolved, phenomena of binocular vision.
Philosophical Transactions of the Royal Society of London, 2, 371394.
Whitehead, A. N. (1911). An Introduction to Mathematics. Williams and Northgate, London.
Whitehead, A. N. and Russell, B. (1910). Principia Mathematica. Cambridge University Press, Cambridge,
UK.
937
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Whorf, B. (1956). Language, Thought, and Reality. MIT Press. Cambridge, Massachusetts.
Widrow, B. (1962). Generalization and information storage in networks of adaline neurons. In Yovits, M. C.
Jacobi, G. T., and Goldstein, G. D. (Eds.), Self-Organizing Systems 1962, pp. 435461, Chicago, Illionis.
Spartan.
Widrow, B. and Hoff, M. E. (1960). Adaptive switching circuits. In 1960 IRE WESCON Convention Record,
pp. 96104, New York.
Wiener, N. (1942). The extrapolation, interpolation, and smoothing of stationary time series. Osrd 370, Report
to the Services 19, Research Project DIC-6037, MIT, Cambridge, Massachusetts.
Wiener, N. (1948). Cybernetics. Wiley, New York.
Wilensky, R. (1978). Understanding goal-based stories. Ph.D. thesis, Yale University, New Haven, Conecticut.
Wilensky, R. (1983). Planning and Understanding. Addison-Wesley, Reading, Massachusetts.
Wilkins, D. E. (1980). Using patterns and plans in chess. Artificial Intelligence, 14(2), 165203.
Wilkins, D. E. (1988). Practical Planning: Extending the AI Planning Paradigm. Morgan Kaufmann, San
Mateo, California.
Wilkins, D. E. (1990). Can AI planners solve practical problems?. Computational Intelligence, 6(4), 232246.
Wilkins, D. E., Myers, K. L., Lowrance, J. D., and Wesley, L. P. (1995). Planning and reacting in uncertain and
dynamic environments. Journal of Exprimental and Theoretical AI, 7(1), 197227.
Wilks, Y. (1975). An intelligent analyzer and understanding of English. Communications of the ACM, 18(5),
264274.
Williams, R. J.(1992). Simple statistical gradient-following algorithms for connectionist reinforcement learning.
Machine Learning, 8, 229256.
Williams, R. J. and Baird, L. C. I. (1993). Tight performance bounds on greedy policies based on imperfect
value functions. Tech. rep. NU-CCS-93-14, College of Computer Science, Northeastern University, Boston.
Wilson, R. A. and Keil, F. C. (Eds.). (1999). The MIT Encyclopedia of the Cognitive Sciences. MIT Press,
Cambridge, Massachusetts.
Winograd, S. and Cowan, J. D. (1963). Reliable Computation in the Presence of Noise. MIT Press, Cambridge,
Massachusetts.
Winograd, T. (1972). Understanding natural language. Cognitive Psychology, 3(1), 1191.
Winston, P. H. (1970). Learning structural descriptions from examples. Technical report MAC-TR-76,
Department of Electrical Engineering and Computer Science, Massachusetts Institute of Technology,
Cambridge, Massachusetts.
Winston, P. H. (1992). Artificial Intelligence (Third edition). Addison-Wesley, Reading, Massachusetts.
Wirth, R. and ORorke, P. (1991). Constraints on predicate invention. In Machine Learning: Proceedings of the
Eighth International Workshop (ML-91), pp. 457461, Evanston, Illionis. Morgan Kaufmann.
Witten, I. H. and Bell, T. C. (1991). The zero frequency problem: Estimating the probabilistic of novel events in
adaptive text compression. IEEE Transactions on Information Theory, 37(4), 10851094.
Witten, I. H., Moffat, A., and Bell, T. C. (1999). Managing Gigabytes: Compressing and Indexing Documents
and Images (second edition). Morgan Kaufmann, San Mateo, California.
Wittgenstein, L. (1922). Tractatus Logico-Philosophicus (second edition). Routledge and Kegan Paul, London.
Reprinted 1971, edited by D. F. Pears and B. F. McGuinness. This edition of the English translation also
938
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
contains Wittgensteins original German text on facing pages, as well as Bertrand Russells introduction to the
1922 edition.
Wittgenstein, L. (1953). Philosophical Investigations. Macmillan, London.
Wojciechowski, W. S. and Wojcik, A. S. (1983). Automated design of multiple-valued logic circuits by
automated theorem proving techniques. IEEE Transactions on Computers, C-32(9), 785 798.
Wojcik, A. S. (1983). Formal design verification of digital systems. In ACM IEEE 20th Design Automation
Conference Proceedings, pp. 228 234, Miami Beach, Florida. IEEE.
Wood, M. K. and Dantzig, G. B. (1949). Programming of interdependent activities. i. general discussion.
Econometrica, 17, 193199.
Woods, W. A. (1973). Progress in natural language understanding: An application to lunar geology. In AFIPS
Conference Proceedings, Vol. 42, pp. 441450.
Woods, W. A. (1975). Whats in a link? Foundations for semantic networks. In Bobrow, D. G. and Collins, A.
M. (Eds.), Representation and Understanding: Studies in Cognitive Science, pp. 3582. Academic Press, New
York.
Woods, W. A. (1978). Semantics and quantification in natural language question answering. In Advances in
Computers. Academic Press.
Wooldridge, M. and Rao, A. (Eds.). (1999). Foundations of national agency. Kluwer, Dordrecht, Netherlands.
Wos, L., Carson, D., and Robinson, G. (1964). The unit preference strategy in theorem proving. In Proceedings
of the Fall Joint Computer Conference, pp. 615621.
Wos, L., Carson, D., and Robinson, G. (1965). Efficiency and completeness of the set-of-support strategy in
theorem proving. Journal of the Association for Computing Machinery, 12, 536541.
Wos, L., Overbeek, R., Lusk, E., and Boyle, J. (1992). Automated Reasoning: Introduction and Applications
(second edition). McGraw-Hill, New York.
Wos, L. and Robinson, G. (1968). Paramodulation and set of support. In Proceedings of the IRIA Symposium on
Automatic Demonstration, pp. 276310. Springer-Verlag.
Wos, L., Robinson, G., Carson, D., and Shalla, L. (1967). The concept of demodulation in theorem proving.
Journal of the Association for Computing Machinery, 14, 698704.
Wos, L. and Winker, S. (1983). Open questions solved with the assistance of AURA. In Bledsoe, W. W. and
Loveland, D. (Eds.), Automated Theorem Proving: After 25 Years: Proceedings of the Special Session of the
89th Annual Meeting of the American Mathematical Society, pp. 7188, Denver, Colorado. American
Mathematical Society.
Wright, S. (1921). Correlation and causation. Journal of Agricultural Research, 20, 557585.
Wright, S. (1931). Evolution in Mendelian populations. Genetics, 16, 97159.
Wright, S. (1934). The method of path coefficients. Annals of Mathematical Statistics, 5, 161215.
Wu, D. (1993). Estimating probability distributions over hypotheses with variable unification. In Proceedings of
the Thirteenth International Joint Conference on Artificial Intelligence (IJCAI-93), pp. 790795, Chambery,
France. Morgan Kaufmann.
Wygant, R. M. (1989). CLIPS a powerful development and delivery expert system tool. Computers and
Industrial Engieneering, 17, 546549.
Yamada, K. and Knight, K. (2001). A syntax-based statistical transaction model. In Proceedings of the Thirty
Ninth Annual Conference of the Association for Computational Linguistics, pp. 228235.
939
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Yang, Q. (1990). Formalizing planning knowledge for hierarchical planning. Computational Intelligence, 6, 12
24.
Yang, Q. (1997). Intelligent planning: A decomposition and abstraction based approach. Springer-Verlag,
Berlin.
Yedidia, J., Freeman, W., and Weiss, Y. (2001). Generalized belief propagation. In Leen, T. K. Dietterich, T.,
and Tresp, V. (Eds.), Advances in Neural Information Processing Systems 13. MIT Press, Cambridge,
Massachusetts.
Yip, K. M.-K. (1991). KAM: A System for Intelligently Guiding Numerical Experimentation by Computer. MIT
Press, Cambridge, Massachusetts.
Yngve, V. (1955). A model and an hypothesis for language structure. In Locke, W. N. and Booth, A. D. (Eds.),
Machine Translation of Languages, pp. 208226. MIT Press, Cambridge, Massachusetts.
Yob, G. (1975). Hunt the wumpus!. Creative Computing, Sep/Oct.
Yoshikawa, T. (1990). Foundations of Robotics: Analysis and Control. MIT Press, Cambridge, Massachusetts.
Young, R. M. Pollack, M. E., and Moore, J. D. (1994). Decomposition and causality in partial order planning.
In Proceedings of the 2nd International Conference on Artificial Intelligence Planning Systems (AIPS-94), pp.
188193, Chicago.
Younger, D. H. (1967). Recognition and parsing of context-free languages in time n3. Information and Control,
10(2), 189208.
Zadeh, L. A. (1965). Fuzzy sets. Information and Control, 8, 338353.
Zadeh, L. A. (1978). Fuzzy sets as a basis for a theory of possibility. Fuzzy Sets and Systems, 1, 328.
Zaritskii, V. S., Svetnik, V. B. and Shimelevich, L. I. (1975). Monte-Carlo technique in problems of optimal
information processing. Automation and Remote Control, 36, 201522.
Zelle, J. and Mooney, R. J. (1996). Learning to parse database queries using inductive logic programming. In
Proceedings of the Thirteenth National Conference on Artificial Intelligence, pp. 1050 1055.
Zermelo, E. (1913). Uber Eine Anwendung der Mengenlehre auf die Theorie des Schachspiels. In Proceedings
of the Fifth International Congress of Mathematicians, Vol. 2, pp. 501504.
Zermelo, E. (1976). An application of set theory to the theory of chess-playing. Firbush News, 6, 3742.
English translation of (Zermelo 1913).
Zhang, N. L. and Poole, D. (1994). A simple approach to bayesian network computations. In Proceedings of the
10th Canadian Conference on Artificial Intelligence, pp. 171178, Banff, Alberta, Morgan Kaufmann.
Zhang, N. L. and Poole, D. (1996). Exploiting causal independence in Bayesian network inference. Journal of
Artificial Intelligence Research, 5, 301328.
Zhou, R. and Hansen, E. (2002). Memory-bounded A* graph search. In Proceedings of the 15th International
Flairs Conference.
Zhu, D. J. and Latombe, J.-C. (1991). New heuristic algorithms for efficient hierarchical path planning. IEEE
Transaction on Robotics and Automation, 7(1), 920.
Zilberstein, S. and Russell, S. J. (1996). Optimal composition of real-time systems. Artificial Intelligence, 83,
181213.
Zimmermann, H.-J. (Ed.). (1999). Practical application of fuzzy technologies. Kluwer, Dordrecht, Netherlands.
Zimmermann, H.-J. (2001). Fuzzy Set Theory And Its Applications (Fourth edition). Kluwer, Dordrecht,
Netherlands.
940
Created by XMLmind XSL-FO Converter.
Irodalomjegyzk
Zobrist, A. L. (1970). Feature Extraction and Representation for Pattern Recognition and the Game of Go.
Ph.D. thesis, University of Wisconsin.
Zuse, K. (1945). The Plankalkl. Report 175, Gesellschaft fr Mathematik und Datenverarbeitung, Bonn,
Germany.
Zweig, G. and Russell, S. J. (1998). Speech recognition with dynamic Bayesian networks. In Proceedings of the
Fifteenth National Conference on Artificial Intelligence (AAAI-98), pp. 173180, Madison, Wisconsin. AAAI
Press.
941
Created by XMLmind XSL-FO Converter.
942
Created by XMLmind XSL-FO Converter.
Aszals L.: A sakk hatsa a kutatsra A jtkfk az gig nnek. 1996(5), 5152.
Aszals L.: Nyelviskola A Prolog mint kvetkeztet rendszer. 1995(8), 4547.
Aszals L.: Mestersges tancsadk Szupergrf a hzibulhoz. 1996(4), 3840.
Aszals L.: Izgalmas gondolkodsutnzatok Logika s tmrts. 1996(8), 3640.
Bessenyei Z., Tomcsnyi T.: Turbgenertor-rezgsdiagnosztika. 1992(9), 42.
Borsodi G.Lois L.: Elkszletek a beszdfelismershez I-II. 1995(2), 3940., 1995(3), 3436.
Farkas E.: A vilgmodellek korltos vilga I-II. 1993(10), 2526., 1993(11), 4546.
Farkas Z.: A rendszer mint diagnoszta. Nvny- s tudsnvekmny-vdelem. 1994(1), 37.
Farkas Zs.: MProlog-alapon. 1992(9), 3839.
Fekete I.: Tudsreprezentci I-II. 1992(6), 23.25., 1992(7), 1921.
Fut I.: Az EXPO kockzata. 1992(9), 4041.
Galntai Z.: Egyszer szablyok bonyolult kvetkezmnyekkel Az letjtk is lehet szenvedly. 1996(7), 4547.
Horvth I.: Intelligens CAD rendszerek I-II. 1994(9), 2728., 1995(12), 2729.
Horvth I.: Tervezi stratgik s eljrsok. Vannak mg problmk. 1995(2), 3437.
Horvth I.: A tervezs szakrtrendszerei I-II. 1995(4), 5051., 1995(5), 5152.
Horvth I.: Az alaksajtossg paradigma Nem elg tervezni, kivitelezni is kell! 1995(6), 5051.
Horvth I.: A lnyeg burkoltan Sajtos alakfelismers. 1995(7), 5051.
Horvth I.: Tanulni nehz de valahogy kell. A rendszer intelligencija. 1995(8), 4850.
Istenes P.: Karakterolgia a mtrixrcson. A kzrs felismerse. 1993(9), 3537.
Jakab .: A CNN univerzlis szmtgp s szuperszmtgp-chip. sszefogva a neuro-biolgusokkal. 1994(7),
1416.
Jakab .: Ember tervez 1994(8), 27.
Jakab .: Mert utlunk robotolni 1994(2), 37.
Jakab .: Videre necesse est. 1993(2), 25.
Koch P.: A titkos tuds. Forrsok s ktfk. 1992(10), 2021.
K A.Lovrics L.: j csillag a kzgazdasgi modellezsben: Backpropagation. 1993.
Lindner L.: Genius 2 a sakk-kirly. Gpek lesznek a sakkvilgbajnokok? 1994(12), 1315.
Pirk J.: 3 D(imenzi) biolgiai s optikai szemszgbl. A szemez szmtgp. 1993(8), 3235.
Sntn-Tth E.: Mestersges intelligencia. Agyszer s nagyszer. 1992(2), 1314.
Sntn-Tth E.: A tuds minden eltt! 1992(8), 1720.
Sntn-Tth E.: Szakrtrendszer-projektek s -alkalmazsok. 1992(9), 3738.
Seregy L.: Lektorlva 15 ezertl 15 millirdig? A magyar szkincs. 1993(11), 3940.
Strausz Gy.: Mestersges neurlis hlzatok I-II. 1992(12), 1820.,1993(1), 2527.
943
Created by XMLmind XSL-FO Converter.
Strausz Gy.: gynkk s stratgik; genetikus algoritmusok s kromoszmk - Elosztott intelligens rendszerek.
1995(12), 5152.
Szeredi P.: VAGY- s S- fggetlen s fgg Prhuzamos logikai programozs. 1996(1), 3840.
Szts M.: Automatikus ttelbizonyts. 1992(5), 2022.
Tar J.: Mestersges mesterek I-V. 1994(2), 3739., 1994(3), 3537., 1994(5), 4546., 1994(6), 37., 1994(7), 37
38.
Vmos T.: Ember s ember kztt. 1992(4), 4445.
Vncza J.: Mit tanulhatunk mi a gp tanulsbl? Tud(hat)-e a gp tanulni? 1992(11), 3134.
Alkalmazsok s hatrterletek
ll G.Hegeds Gy. s trsai: A Digitlis kpfeldolgozs alapproblmi. Akadmiai Kiad, Budapest, 1989.
ll G., Fglein J. s trsai: Bevezets a szmtgpes kpfeldolgozsba javtott kiads. BME
Mrnktovbbkpz Intzet, Egyetemi jegyzet, Budapest, 1993.
Bach I.: Szmtstechnikai nyelvszet. BME, Budapest, 1991.
Bach I., Farkas E., Naszdi M.: A magyar nyelv elemzse szmtgppel. SZTAKI Tanulmnyok, 199/1987.
Bacz E.Takcs E.: Kis magyar nyelvtan. Gondolat Talentum, Budapest, 1996.
Benk T.Lukcsy G.Szeredi P.: A Szemantikus Vilghl elmlete s gyakorlata. Typotex, Budapest, 2005.
Berke J.Hegeds Gy. s trsai: Digitlis kpfeldolgozs s alkalmazsai. Keszthelyi Akadmia Alaptvny,
Keszthely, 1996.
Copi XX.Irving M.Gould, J. A.: Kortrstanulmnyok a logikaelmlet krdseirl. Gondolat, Budapest, 1985
Csibi S. (szerk.): Informci kzlse s feldolgozsa. Tanknyvkiad, Budapest, 1986.
Kasztkin, V. N.Valdkina, L. I.: Algoritmusok s jtkok. Tanknyvkiad, Budapest, 1988.
Kenesei I. (szerk.): A nyelv s a nyelvek, Akadmiai Kiad, Budapest, 1995, 2004.
Kovcs P. A.: Sakkprogramozsrl mindenkinek, Novotrade Rt., 1987.
Kovcs M.Olaszy G.Niklczy P.Gsy M.: Magyar nyelvi beszdtechnolgiai alapismeretek. (600 oldal CDROM-on). Szerk.: Olaszy G., Nikol Kiad, Budapest, 2002.
Lipi G.Nemes .Novk I.: A knai hadseregtl az utaz gynkig. Grfok gpkzelben. Novotrade Kiad,
1990.
Lukcs O.: Matematikai Statisztika. Mszaki Knyvkiad, Budapest, 1996
Olaszy G.Kovcs M.Niklczy P.Gsy M.: Magyar nyelvi beszdtechnolgiai alapismeretek. (600 oldal CDROM-on). Szerk.: Olaszy G., Nikol Kiad, Budapest, 2002.
Psztorn Varga K.: Logikai alapozs alkalmazsokhoz. Matematikai logika szmtstudomny. ELTE
Budapest, Egyetemi jegyzet, 1997
Psztorn Varga K.Vrtersz M.: Matematikai logika alkalmazsszemllet trgyalsa. Panem, Budapest,
2003.
Pinker S.: A nyelvi sztn. Hogyan hozza ltre az elme a nyelvet? Typotex, 1999, Budapest
Plh Cs.: A mondatmegrts a magyar nyelvben. Osiris, Budapest, 1998.
Prkopa A.: Valsznsgelmlet mszaki alkalmazsokkal, Mszaki Knyvkiad, Budapest, 1980.
944
Created by XMLmind XSL-FO Converter.
945
Created by XMLmind XSL-FO Converter.
Molnr A.: Elektromos hajts robotreplgpek. Haditechnika 2002 Nemzetkzi Szimpzium, 2002.
szeptember 1617, Zrnyi Mikls Nemzetvdelmi Egyetem Bolyai Jnos Katonai Mszaki Fiskolai Kar,
Budapest, Bolyai Szemle klnsz. II. 2133. o.
Paczolay, D.Kocsor, A.Sejtes, Gy.Hgely, G.: A Beszdmester csomag bemutatsa, informatikai s nyelvi
aspektusok. Alkalmazott Nyelvtudomny, IV(1), 2004, 5779. o.
Roska T.: Egyszer s bonyolult fogalmak s mrtkek mestersges s l rendszerekben. Bevezet. Magyar
Tudomny, 48(3), 2003, 290291. o.
Roska T.: Bonyolultsg s egyszersg analogikai hullm-szmtgpekben s nhny idegi jelensg
modelljben. Magyar Tudomny, 48(3), 2003, 328331. o.
Roska T.Blya D.Csapodi M.Zarndy .: Analogikai cellulris szmtgpek. Egy j szmtgpelv.
Termszet Vilga, 2000, II. klnsz., 7174. o.
Sntn-Tth E.: Szakrt rendszerek fejlesztsnek mdszertani s oktatsi krdsei. Informatika az
oktatsban 2002 Konferencia CD-kiadvnya, Debrecen, 2002. aug. 2830, 6. o.
Starkn Werner .: Szakrti rendszer lehetsgek a kmiaoktatsban. A kmia tantsa mdszertani folyirat,
VI. vf. 1998, 34.
Starkn Werner .: Mestersges intelligenciabeli lehetsgek az internetes s multimdis fldrajz oktatsban.
A fldrajz tantsa mdszertani folyirat, XII. vf. 2004(1), 37. o.
Starkn Werner ., Vgh K.: Dntst tmogat szakrti rendszer az aromaterpiban. XXI. Neumann
Kollokvium, Veszprm 1998. nov. 1214., 200204. o.
Szeredi P.Gyimthy T.: Logikai programozs s alkalmazsai. IX. Neumann centenriumi Kongresszus
kiadvnya, NJSZT, 2003. 181198. o.
Tatai G.Laufer L.: Nyelvi elemek rzelmi tltetnek vizsglata s felhasznlsa termszetes nyelvi
dialgusrendszerben. Magyar Szmtgpes Nyelvszet Konferencia (MSZNY), 2003. Szeged, 102107. o.
Tatai G.Laufer L.Csords A.Fegy T.: Interaktv, szintetikus tanrok az e-oktatsban. Multimdia az
oktatsban Fkuszban az e-learning gyakorlata Konf. kiadvnya, 2004. Szeged, 2729. o.
Tth L.Kocsor A.: Az MTBA magyar telefonbeszd-adatbzis kzi feldolgozsnak tapasztalatai. In Gsy M.
(szerk.): Beszdkutats 2003. 134146. o.
Vmos T.: Fizika fszisz informcis trsadalom. Fizikai Szemle, 2005/1. Fizika ve sz., 8. o.
Velencei J.: Lerhat-e a tuds? CEO magazin. 2000. 3. sz.
Viharos Zs. J.: Megmunklt felletek minstse neurlis hl alkalmazsval. Fiatal Mszakiak Tudomnyos
lsszaka, Kolozsvr, 1996. 713. o.
Elektronikus forrsok
Kis B.: Mi van a szavakon tl? Nyelvtani szerkezetek felismerse szmtgppel.
http://www.mek.iif.hu/porta/szint/tarsad/nyelvtud/mivana/mivana.htm
Naszdi M.: Nyelvhelyessg-ellenrzs szmtgppel.
http://www.mek.iif.hu/porta/szint/tarsad/nyelvtud/nylvhely/nyelvhely.htm
Sntn-Tth E. (szerk.): Magyar Mestersges Intelligencia Bibliogrfia Vlogats az 1988 1996 kztt
megjelent
publikcikbl.
NJSZT
OMIKK,
Budapest,
1996.
aug.
(400
referencia)
http://www.mek.iif.hu/porta/szint/egyeb/katalog/mi-bibl
946
Created by XMLmind XSL-FO Converter.