Anda di halaman 1dari 37

la thorie des jeux, 1 CO8 2012-2013

M. Cozic

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

1. Les jeux sous forme normale et lquilibre de Nash

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

1.1. Linteraction stratgique et les jeux sous forme normale

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

les interactions stratgiques


thorie des jeux = thorie gnrale des interactions stratgiques = actions individuelles sont dtermines en fonction des actions des autres agents interdpendance stratgique = les consquences de ce quun agent fait dpendent de ce que font les autres agents prenant part linteraction

Figure: Von Neumann & Morgenstern (1944/1947)


M. Cozic

Figure: Nash (1951)

la thorie des jeux, 1 CO8 2012-2013

les interactions stratgiques


exemples: 2 enfants jouant pierre-feuille-ciseaux un goal qui doit dcider o se jeter et un joueur de champ qui doit dcider o tirer le pnalty 2 nations ennemies qui doivent dcider si elles augmentent ou pas leur arsenal militaire 2 conducteurs dont les routes se croisent des entreprises, en petit nombre, produisant le mme bien et devant dcider de la quantit de ce bien quelles sapprtent produire (oligopole de Cournot) des internautes qui enchrissent sur eBay

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

matching pennies
2 joueurs, chacun possde une pice et il doit choisir secrtement lun des deux cts. Le joueur 1 gagne si les deux cts sont les mmes, le joueur 2 sils sont diffrents. F (1, 1) (1, 1) P (1, 1) (1, 1)

F P

autre histoire pour la mme reprsentation: le jeu du dbarquement. 2 gnraux ennemis doivent choisir entre deux endroits, lun pour dbarquer, lautre pour empcher le premier de dbarquer. Si le dfenseur choisit lendroit choisi par lattaquant, il gagne, sinon il perd.

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

pierre-feuille-ciseaux
un jeu comme matching pennies, o les prfrences des joueurs sont systmatiquement opposes, sappelle un jeu somme nulle. Voici un autre exemple:

F P C

F (0, 0) (1, 1) (1, 1)

P (1, 1) (0, 0) (1, 1)

C (1, 1) (1, 1) (0, 0)

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

le jeu de la poule mouille


Les deux joueurs roulent lun vers lautre au milieu de la route. Tous deux arrivent au point de non-retour et doivent dcider sils cdent C i.e. sils se rabattent sur leur voie, ou sils tiennent T i.e. restent au milieu de la route. Ils nont pas le temps de voir la dcision de lautre avant de prendre la leur.

http: //www.youtube.com/watch?v= U1DEp8R9kwg&feature=related


M. Cozic la thorie des jeux, 1 CO8 2012-2013

le jeu de la poule mouille


Les deux joueurs roulent lun vers lautre au milieu de la route. Tous deux arrivent au point de non-retour et doivent dcider sils cdent C i.e. sils se rabattent sur leur voie, ou sils tiennent T i.e. restent au milieu de la route. Ils nont pas le temps de voir la dcision de lautre avant de prendre la leur. si (T , T ), lissue est catastrophique pour tous les deux. si (T , C ), cest lidal pour le joueur 1 qui nest pas une poule mouille si (C , C ), les deux sont des poules mouilles, mais ils sont sains et saufs ! C (3, 3) (4, 2) T (2, 4) (0, 0)

C T

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

dnition dun jeu (sous forme stratgique)

un jeu (sous forme stratgique) G = I , {Ai }i I , {ui }i I est la donne dun ensemble de joueurs I dun ensemble dactions Ai pour chaque joueur i dune fonction dutilit ui pour chaque joueur i qui value chaque prol dactions possible a A = A1 ... AI

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

1.2. Domination et limination itre des stratgies domines

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

le dilemme du prisonnier
2 joueurs souponns davoir commis ensemble un crime majeur, arrts et interrogs sparment par les policiers qui ont assez dlments pour les convaincre dun crime mineur. Chacun peut tmoigner contre lautre (T ) ou ne pas le faire (C ). si (C , C ), alors 1 an de prison chacun si (T , T ), alors 3 ans de prison chacun si (T , C ) ou (C , T ), celui qui trahit est libr, celui qui ne trahit pas passe 4 ans en prison C (3, 3) (4, 0) T (0, 4) (1, 1)

C T

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

rsoudre le dilemme du prisonnier


quel comportement doit-on attendre de joueurs rationnels dans le dilemme ? raisonnement du joueur 1: - si 2 tmoigne contre moi (joue T ), alors jai intrt tmoigner contre lui - si 2 ne tmoigne pas contre moi (joue C ), alors jai intrt tmoigner contre lui conclusion: jai intrt tmoigner contre lui, i.e. jouer T . Mme raisonnement pour le joueur 2. C T C (3, 3) (4, 0) T (0, 4) (1, 1)

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

rsoudre le dilemme du prisonnier


C (3, 3) (4, 0) T (0, 4) (1, 1)

C T

T est une stratgie strictement dominante : une stratgie telle que, quelle que soit celle choisie par lautre joueur, lutilit quelle procure est strictement suprieure celle que procurent les autres stratgies envisageables le principe de dominance est le principe qui dit de choisir les stratgies strictement dominantes (T , T ) est lissue laquelle on aboutit si chaque joueur se conforme au principe de dominance

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

la domination stricte
Dnitions La stratgie ai Ai domaine strictement ai Ai si pour tout ai Ai , ui (ai , ai ) ui (ai , ai ) ai Ai est strictement dominante si elle domine strictement toute ai Ai rem 1: sil existe une stratgie str. dominante, alors elle est unique. rem 2: sil existe une stratgie str. dominante, un joueur peut la trouver sans Dnition Un prol de stratgie a = (a1 , ..., ai , ..., aI ) A est un quilibre en stratgies str. dominantes si pour chaque joueur i , ai est strictement dominante.

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

remarques sur le dilemme du prisonnier


C T C (3, 3) (4, 0) T (0, 4) (1, 1)

le Dilemme est sans dout le jeu le plus clbre. Pas seulement parce quil illustre lquilibre en stratgie dominante, mais parce que (i) il semble correspondre de nombreuses situations sociales et (ii) lissue recommande par lquilibre ne parat pas collectivement rationnelle ou efcace. le concept de rationalit collective est partiellement reprsent par celui de Pareto-domination Dnition Un prol de stratgie a = (a1 , ..., ai , ..., aI ) A Pareto-domine autre autre prol a = (a1 , ..., ai , ..., aI ) A si pour tout joueur i I , ui (a) > ui (a ).
M. Cozic la thorie des jeux, 1 CO8 2012-2013

remarques sur le dilemme du prisonnier


C (3, 3) (4, 0) T (0, 4) (1, 1)

C T

dans le Dilemme, (C , C ) Pareto-domine (T , T ). On en conclut quil y a conit entre la rationalit individuelle (incarne par le principe de dominance) et la rationalit collective (incarne par le Principe de Pareto). pour certains, cela implique quil y a un problme avec le principe de dominance ; pour dautres, simplement que rationalits individuelle et collective ne vont pas toujours de pair !

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

la domination faible
le principe de dominance ne permet pas en gnral de rsoudre un jeu: trs souvent, il nexiste pas de stratgie dominante (et donc pas dquilibre en stratgies str. dominantes) ! cest le cas du jeu de la poule mouille C T C (3, 3) (4, 2) T (2, 4) (0, 0)

on peut tendre le concept aux stratgies qui sont au moins aussi bonnes que les autres et parfois strictement meilleures Dnition La stratgie ai Ai domaine faiblement ai Ai si pour tout ai Ai , ui (ai , ai ) ui (ai , ai ) il existe un ai Ai t.q. ui (ai , ai ) > ui (ai , ai ) ai Ai est faiblement dominante si elle domine faiblement toute ai Ai
M. Cozic la thorie des jeux, 1 CO8 2012-2013

la dominance faible
exemple: C T C (3, 3) (3, 0) T (0, 4) (1, 1)

dans cette variante du Dilemme, le joueur 1 na plus de stratgies (strictement) dominantes, mais T est malgr tout faiblement dominante exemple: a1 a2 a3 b1 (0, 1) (3, 0) (1, 0) b2 (4, 2) (2, 1) (3, 0)

dans ce jeu, le joueur 2 a une stratgie (faiblement) dominante (laquelle ?), mais pas le joueur 1
M. Cozic la thorie des jeux, 1 CO8 2012-2013

enchres au second prix


processus: chaque joueur i annonce un offre oi [0, +] chaque joueur value le bien aux enchres vi lobjet est offert celui qui offre le plus, mais il le paye au prix de la seconde offre: ui (o1 , ..., on ) = vi maxj =i oj si oi > maxj =i oj 1/m (vi maxj =i oj ) si oi = maxj =i oj et sil y a m vainqueurs 0 si oi < maxj =i oj

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

enchres au second prix


annoncer son valuation (i.e. oi = vi ) est une stratgie faiblement dominante (a) pour tout oi = vi , vi est au moins aussi bon que oi . si vi < maxj =i oj . Avec oi < maxj =i oj , i obtient zro, tandis que si oi maxj =i oj , paiement ngatif. si vi > maxj =i oj . Avec vi ou quoique ce soit de strct. sup. maxj =i oj , i obtient vi maxj =i oj > 0. En pariant vi = maxj =i oj , i devra partager et donc il obtiendra moins. Avec vi < maxj =i oj , il obtiendra zro. si vi = maxj =i oj . Toute offre rapporte alors zro. (b) pour tout oi = vi , il y a des oi telles que vi est strict. meilleure que oi . (i) si oi > vi , quand maxj =i (vi , oi ), vi rapporte zro, oi donne un paiement ngatif. (ii) si oi < vi , quand maxj =i (oi , vi ), vi rapporte vi maxj =i oj et oi zro.
M. Cozic la thorie des jeux, 1 CO8 2012-2013

la dominance faible
regardons lun des jeux prcdents une seconde fois le jeu prcdent: b1 (0, 1) (3, 0) (1, 0) b2 (4, 2) (2, 1) (3, 0)

a1 a2 a3

le joueur 1 peut compter sur le fait que le joueur 2 jouera b2 . Il peut alors rduire le jeu prcdent au jeu suivant: b2 (4, 2) (2, 1) (3, 0)

a1 a2 a3

...il aura alors une stratgie dominante: a1 .


M. Cozic la thorie des jeux, 1 CO8 2012-2013

llimination itre
dans lexemple prcdent, rle essentiel des croyances du joueur 1 sur la rationalit du joueur 2 entendue comme le fait quil jouera une stratgie dominante on peut dvelopper ces ides partir du concept de stratgie domine: Dnition La stratgie ai Ai est strictement domine sil existe une stratgie ai Ai qui la domine strictement. attention: dans un jeu, il se peut quun joueur ait des stratgies strictement domines sans pour autant avoir de stratgies dominantes. exemple: a1 a2 a3
M. Cozic

b1 (0, 1) (3, 0) (1, 0)

b2 (0, 2) (2, 1) (3, 0)

la thorie des jeux, 1 CO8 2012-2013

llimination itre des stratgies strictement domines


b1 (4, 3) (2, 1) (3, 0) b2 (5, 1) (8, 4) (9, 6) b3 (6, 2) (3, 6) (4, 8)

a1 a2 a3

a2 est strictement domine par a3 donc, sous lhypothse que le joueur 1 est rationnel, le joueur 2 peut rduire son incertitude la question de savoir sil jouera a1 ou a3 b2 est strictement domine par b3 donc, sous lhypothse que le joueur 2 est rationnel, le joueur 1 peut rduire son incertitude la question de savoir sil jouera b1 ou b3

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

llimination itre des stratgies strictement domines


on peut donc rduire le jeu initial au jeu suivant: a1 a3 b1 (4, 3) (3, 0) b3 (6, 2) (4, 8)

a3 est strictement domine par a1 donc, sous lhypothse que le joueur 1 est rationnel et quil croit que le joueur 2 est galement rationnel, le joueur 2 peut anticiper que le joueur 1 jouera a1

Le jeu est alors rduit a1 b1 (4, 3) b3 (6, 2)

la stratgie b3 devient alors domine par b1 . On obtient donc comme prol de stratgies (a1 , b1 )
M. Cozic la thorie des jeux, 1 CO8 2012-2013

llimination itre des stratgies strictement domines


on appelle ce raisonnement llimination itre des stratgies strictement domines (EISSD) les curieux peuvent aller voir la Dnition dans lAppendice. un quilibre par EISSD est un prol de stratgies tel que chaque stratgie survit lEISSD. un jeu G est rsoluble par dominance sil possde un unique quilibre par EISSD1 .
cest le cas dans lexemple prcdent

Def. un peu plus gnrale: pour chaque joueur, les stratgies qui survivent sont quivalentes i.e. procurent la mme utilit quelles que soient les stratgies survivantes des autres joueurs.
M. Cozic la thorie des jeux, 1 CO8 2012-2013

le jeu du concours de beaut


choisissez un nbre entre 0 et 100 ; le gagnant sera celui dont le nombre est le plus proche des 2/3 de la moyenne Quel nbre xi doit choisir le joueur i ? tape 1: la 2/3-moyenne est dans [0, 200/3] donc les xi ]200/3, 100] sont faiblement domins dans le jeu initial G0 = G: ils ne rapportent jamais plus et parfois strictement moins que xi = 200/3. le processus dlimination itre des stratgies faiblement domines (EISFD) peut tre poursuivi: tape 2: la 2/3-moyenne des xi dans le jeu rduit G1 est ds [0, 400/9] donc les xi ]400/9, 200/3] dans le jeu rduit sont faiblement domins donc sont limins. ... lunique quilibre par EISFD est le prol (0, ..., 0).
M. Cozic la thorie des jeux, 1 CO8 2012-2013

le jeu du concours de beaut

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

le jeu du concours de beaut

particularit du prol (0, ..., 0): un joueur i na pas intrt dvier tant donn le choix des autres. nous reviendrons trs vite sur cette proprit

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

sur lorigine de concours de beaut


Keynes Thorie gnrale de lemploi, de lintrt et de la monnaie (1936) compare les marchs nanciers au jeu du concours de beaut: Ou encore, pour varier lgrement la mtaphore, la technique du placement peut tre compare ces concours organiss par les journaux o les participants ont choisir les six plus jolis visages parmi une centaine de photographies, le prix tant attribu celui dont les prfrences sapprochent le plus de la slection moyenne opre par lensemble des concurrents. Chaque concurrent doit donc choisir non les visages quil juge lui-mme les plus jolis, mais ceux quil estime les plus propres obtenir le suffrage des autres concurrents, lesquels examinent tous le problme sous le mme angle.

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

sur lorigine de concours de beaut

Keynes Thorie gnrale de lemploi, de lintrt et de la monnaie (1936) compare les marchs nanciers au jeu du concours de beaut: Il ne sagit pas pour chacun de choisir les visages qui, autant quil en peut juger, sont rellement les plus jolis ni mme ceux que lopinion moyenne considrera rellement comme tels. Au troisime degr o nous sommes dj rendus, on emploie ses facults dcouvrir lide que lopinion moyenne se fera lavance de son propre jugement. Et il y a des personnes, croyons-nous, qui vont jusquau quatrime ou au cinquime degr ou plus loin encore.

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

hypothses sur la rationalit et EISSD


dans le jeu b1 (4, 3) (2, 1) (3, 0) b2 (5, 1) (8, 4) (9, 6) b3 (6, 2) (3, 6) (4, 8)

a1 a2 a3

pour aboutir (a1 , b1 ), nous navons - pas seulement suppos que les joueurs taient rationnels (et quils connaissaient le jeu) ; - pas non plus seulement suppos quils croyaient que lautre tait rationnel (et connaissait le jeu). on est mont dans la hirarchie des croyances en la rationalit de lautre autant de fois que lon a limin de stratgies domines.

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

hypothses sur la rationalit et EISSD


pour tre certain que le raisonnement soit toujours justi, il faut supposer ce quon appelle la connaissance commune dans la rationalit (et dans la structure du jeu): chacun est rationnel, chacun sait que lautre est rationnel, chacun sait que chacun sait que lautre est rationnel, etc. la thorie pistmiques des jeux est la branche qui caractrise de manire prcise les hypothses sur les croyances des agents qui conduisent aux diffrents quilibres.

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

hypothses sur la rationalit et EISSD

question: en quel sens supposer quun joueur est rationnel nous garantit quil ne jouera pas une stratgie strictement domine ? imaginons que le joueur i ait des croyances sur laction que j va jouer. Quelles que soient ses croyances, i a intrt ne pas jouer une stratgie strictement domine on peut rendre cela plus prcis: imaginons que i ait une distribution de probabilit P (.) sur Aj . Alors quelle que soit P (.), lesprance dutilit dune action strictement domine est strictement moins bonne que lEU de celle qui la domine.

M. Cozic

la thorie des jeux, 1 CO8 2012-2013

hypothses sur la rationalit et EISFD


les choses sont un peu diffrentes avec la dominance faible et lEISFD exemple: C T C (3, 3) (3, 0) T (0, 4) (1, 1)

si le joueur i est persuad que le joueur 2 jouera C , alors il na plus intrt ne pas jouer C (la stratgie faiblement domine) ! en termes dEU: si le joueur 1 accorde une probabilit nulle au fait que le joueur 2 joue T , alors EU (C ) = EU (T ). ide: ce qui garantit llimination par un joueur dune stratgie faiblement domine, cest le fait quil soit rationnel et prudent au sens o il naccorde pas de probabilit nulle certaines actions de ladversaire
M. Cozic la thorie des jeux, 1 CO8 2012-2013

dautres complications pour lEISFD


exemple (Heifetz, 2012): b1 (0, 0) (0, 1) b2 (1, 0) (0, 0)

a1 a2

a2 est faiblement domine par a1 et b2 par b1 . LEISFD conduit donc (a1 , b1 ). mais si on commence par liminer b2 , alors a1 ne domine plus (mme faiblement) dans le jeu rsiduel b1 (0, 0) (0, 1)

a1 a2

manque de robustesse de lEISFD lordre dlimination


M. Cozic la thorie des jeux, 1 CO8 2012-2013

rcapitulatif

avec llimination itre des stratgies strictement domines, on arrive en dire plus sur lissue dune interaction stratgique entre joueurs rationnels on ne considre plus simplement des joueurs rationnels, mais des joueurs qui en outre ont connaissance commune de la rationalit de chacun et de la structure du jeu problme: il y a de nombreux jeux o il nexiste pas ou peu de stratgies qui sont limines par le raisonnement (et encore plus de jeux qui ne sont pas rsolubles par dominance)

M. Cozic

la thorie des jeux, 1 CO8 2012-2013