Anda di halaman 1dari 104

4 TEORIA JOCURILOR

1. Noţiuni generale
Teoria jocurilor este teoria matematică care se ocupă cu
determinarea metodelor de alegere a deciziilor în cazuri de competiţie sau
situaţii conflictuale. O situaţie conflictuală este cea în care acţionează doi
sau mai mulţi factori (persoane fizice, firme, partide politice) având scopuri
contrarii. Astfel de situaţii sunt: concurenţa economică, vânzările la licitaţie,
alegerile parlamentare etc.. Teoria jocurilor se ocupă şi de cazurile în care o
activitate intră în conflict cu caracterul întâmplător al unor evenimente
naturale (epidemii, secetă). Pentru construirea unui model formal,
simplificat al situaţiei cercetate se vor selecta caracteristicile principale, cele
secundare neglijându-se. Terminologia folosită este cea de la jocurile de
societate sau de noroc.
Prin joc sau joc strategic se înţelege situaţia în care acţionează o
mulţime de elemente raţionale (numite jucători sau parteneri) care în mod
succesiv şi independent, într-o ordine şi condiţii fixate într-un ansamblu de
reguli, iau câte o decizie (efectuează o mutare) dintr-o mulţime dată de
alternative. Regulile jocului fixează şi situaţiile în care se termină jocul,
precum şi câştigul sau recompensa pentru fiecare jucător. Un joc realizat se
mai numeşte partidă.
Acţiunile întreprinse de jucători în cadrul unei partide se numesc
mutări. Acestea pot fi: libere – când alegerea alternativei este univocă sau
Modele matematice în economie

aleatoare, când alegerea alternativei este supusă întâmplării şi e determinată


de un mecanism aleator (zar).
După cantitatea de informaţie de care dispune fiecare jucător există
jocuri cu informaţie completă (şahul) şi jocuri cu informaţie parţială (bridge-
ul), necunoaşterea intenţiilor adversarului constituind elementul esenţial al
situaţiilor conflictuale.
Ansamblul de reguli ce definesc în mod unic mişcările libere în
funcţie de situaţia ivită în timpul jocului se numeşte strategie. Dacă unul
dintre adversari are la dispoziţie m alternative, iar partida se încheie printr-o
alegere, se spune că jucătorul are la dispoziţie m strategii pure. Când
partidele se repetă, jucătorii pot alege strategii pure cu anumite frecvenţe sau
probabilităţi şi atunci se spune că utilizează o strategie mixtă. Dacă numărul
strategiilor pure este finit, spunem că avem un joc finit, în caz contrar avem
un joc infinit. Fiecare jucător urmăreşte aplicarea unei strategii care să îi
aducă un câştig maxim, deci îşi caută o strategie optimă.
Câştigul pi realizat de jucătorul Pi are semnificaţia unei sume băneşti
sau a unui număr de puncte, bunuri etc.. Dacă pi > 0, jucătorul Pi realizează
un câştig în sensul uzual al cuvântului, iar dacă pi < 0 înregistrează o
pierdere.
Din punct de vedere al câştigului distingem:
- jocuri cu sumă nulă – când la sfârşitul unei partide suma pierdută
de o parte din jucători este câştigată de ceilalţi şi
- jocuri cu sumă nenulă – când jucătorii pot să-şi mărească
concomitent câştigurile, prin alegerea unor strategii adecvate.
După numărul n al jucătorilor, jocurile pot fi cu doi parteneri sau cu
n > 2 parteneri.
Teoria jocurilor

Exemplu [2]
Fie jocul cu doi parteneri P1 şi P2 ce constă în 3 mutări libere. O
mutare înseamnă alegerea unuia dintre numerele a sau b, a ≠ b. La prima
mutare P1 alege liber pe a sau pe b; la a doua mutare P2, informat asupra
alegerii făcute de P1, alege la rândul său unul din numerele a sau b. În
sfârşit, la a treia mutare P1, informat asupra alegerii făcute de P2, alege unul
dintre numerele a sau b.
Observăm că este un joc în doi, cu mutări libere şi informaţie
completă ce poate fi reprezentat printr-un arbore de forma:
(1, -1) (2, 1) (-1, 2) (3, 1) (-2, 1) (1, -3) (2, 3) (1, 2)
a b a b a b a b

a b a b
1 1 1 1

a b
2 2

0
1

Vârful 0 arată momentul iniţial, iar cifra 1 scrisă sub 0 arată că prima
mutare este a lui P1. Din 0 pornesc două muchii spre vârfurile a şi b, ce
reprezintă alegerile lui P1. Sub a şi b scriem 2, pentru că următoarea mutare
este a lui P2. Din fiecare vârf pornesc două muchii spre alte vârfuri a şi b,
reprezentând alegerile lui P2 şi sub aceste vârfuri scriem 1 deoarece P1 face
următoarea mutare spre alte vârfuri notate a şi b (care vor fi vârfuri
terminale). Sub ele nu mai scriem nimic, dar fiecăruia îi asociem un vector
Modele matematice în economie

bidimensional (p1, p2) ale cărui componente reprezintă respectiv câştigurile


celor doi jucători, decurgând din regulile jocului.
S-au obţinut 8 vârfuri terminale ce vor determina tot atâtea partide,
deoarece o partidă este reprezentată de un lanţ ce leagă vârful 0 de unul din
vârfurile terminale. Cele 8 partide sunt: (a, a, a), (a, a, b), (a, b, a), (a, b, b),
(b, a, a), (b, a, b), (b, b, a) şi (b, b, b).
Jocul nu este cu sumă nulă deoarece dacă, de exemplu, s-ar realiza
partida (a, a, b) avem p1 = 2, p2 = 1 şi p1 + p2 = 3 ≠ 0.
Mulţimea strategiilor jucătorului P1 este:
A = ⎨(a, a), (a, b), (b, a), (b, b)⎬, unde primul element din fiecare
pereche reprezintă numărul ales la prima mutare, iar al doilea element indică
numărul ales la a treia mutare.
Mulţimea strategiilor lui P2 este:
B = ⎨(a), (b)⎬, reprezentând alegerile la a doua mutare.
Asociem jocului considerat un tabel cu două intrări A = ⎨A1, ...,A4⎬
- strategiile lui P1 şi B = ⎨B1, B2⎬, strategiile lui P2.
La intersecţia liniei lui Ai cu coloana lui Bj avem un dreptunghi în
care deasupra diagonalei am scris partida, iar dedesubt vectorul (pi, pj) al
câştigurilor celor doi jucători, când aceştia aleg strategiile Ai, respectiv Bj.
B
A B1 = (a) B2 = (b)
A1 = (a, a) (a, a, a) (a, b, a)
(1, -1) (-1, 2)
A2 = (a, b) (a, a, b) (a, b, b)
(2, 1) (3, 1)
A3 = (b, a) (b, a, a) (b, b, a)
(-2, 1) (2, 3)
A4 = (b, b) (b, a, b) (b, b, b)
(1, -3) (1, 2)
Teoria jocurilor

Din acest exemplu observăm că există diferite moduri de


reprezentare a unui joc, cu ajutorul unui arbore sau matricial.
Observaţie: Dacă în acelaşi joc considerăm câştigurile date de
următoarea corespondenţă:
(a, a, a) → (2, -2) (b, a, a) → (1, -1)
(a, a, b) → (-1, 1) (b, a, b) → (3, -3)
(a, b, a) → (4, -4) (b, b, a) → (-2, 2)
(a, b, b) → (5, -5) (b, b, b) → (-3, 3)
jocul va fi: finit, cu informaţie completă, cu mutări libere şi cu sumă nulă,
deoarece p1 + p2 = 0 pentru orice vector (p1, p2).
În acest caz reprezentarea matricială poate fi simplificată, scriind în
locul vectorului (p1, p2) doar câştigul p1 al lui P1, deoarece cel al lui P2 e
cunoscut, egal cu – p1.
Forma simplificată a matricei este:

B B1 = (a) B2 = (b)
A
A1 = (a, a) 2 4
A2 = (a, b) -1 5
A3 = (b, a) 1 -2
A4 = (b, b) 3 -3

2. Jocuri matriceale

Fie un joc finit între doi jucători, în care un jucător are m strategii
pure, iar celălalt n strategii pure. Un astfel de joc se numeşte joc m × n sau
joc matriceal. Dacă jocul este cu sumă nulă, el se va numi antagonist. În
Modele matematice în economie

acest din urmă caz, funcţia de câştig se poate prezenta sub forma unui tabel
de plăţi, adică o matrice m × n, notată cu A, astfel:

⎛ a11 L a1n ⎞
⎜ ⎟
A= ⎜ M M M ⎟ sau A = (aij), i = 1, m , j = 1, n .
⎜a ⎟
⎝ m1 L a mn ⎠
Matricea A se numeşte matricea jocului (matricea câştigurilor).
Elementul aij este câştigul jucătorului P1 când alege strategia Ai şi jucătorul
P2 alege strategia Bj. Această formă matriceală de prezentare a jocului se va
numi forma normală.
Caracteristicile esenţiale ale unui joc sunt:
a) mulţimea strategiilor pure ale jucătorului P 1, notată
A = ⎨A1,..., Am⎬;
b) mulţimea strategiilor pure ale jucătorului P 2, notată
B = ⎨B1,...,Bn⎬;

c) funcţia de câştig f: A × B → ℝ, definită prin f(Ai, Bj) = aij,

i = 1, m , j = 1, n .
Imaginea prin f a produsului cartezian A × B este matricea A.
Matricea A se scrie deci în raport cu un singur jucător şi anume P1,
primul jucător (numit şi jucătorul maximizant, din punct de vedere formal –
ambii jucători urmărind acelaşi scop). Când P1 câştigă valoarea aij, P2
plăteşte lui P1 valoarea aij, i = 1, m , j = 1, n .
Pentru P2 toate elementele matricei au semn contrar (fiind un joc cu
sumă nulă). P2 se mai numeşte jucător minimizant. Vom nota jocul definit în
condiţiile de mai sus prin tripletul: G = (A, B, f).
Teoria jocurilor

Exemplu
În jocul numit „aruncarea monedei”, fiecare jucător alege liber stema
(S) sau valoarea (V). Dacă alegerile coincid, jucătorul P1 primeşte de la P2
un euro. Dacă alegerile diferă, P2 primeşte de la P1 un euro.
Atunci forma normală a jocului pentru P1 este:
P2
(S) (V)
P1
(S) 1 -1
(V) -1 1

2.1 Jocuri cu punct şa

Fie un joc G = (A, B, f), cu matricea A = (aij), i = 1, m , j = 1, n .


Jucătorii sunt consideraţi la fel de competenţi. Ei aderă la un principiu de
comportare, născut din raţionalitate. Astfel, P1 va acţiona aşa încât cel mai
mic câştig asigurat pe care îl poate obţine de la P2 să fie cât mai mare, iar P2
urmăreşte să facă pe cât posibil mai mică, cea mai mare valoare pe care ar
trebui să o dea lui P1. Acest principiu poartă numele de principiul minimax.
Dacă P1 va alege strategia Ai ∈ A, se aşteaptă ca P2 să aleagă acea
strategie Bj ∈ B care să ofere un câştig cât mai mic pentru P1. Fie acesta

αi = min aij, i = 1, m .
1≤ j≤ n

Dintre cele m strategii pure, P1 va alege acea strategie Ai care dă cea


mai mare valoare a lui αi. Notând:
α = max αi = max min aij
i i j

α se va numi valoarea inferioară a jocului şi se mai notează v G .


Modele matematice în economie

Strategia care asigură lui P1 un câştig egal cu v G se numeşte

strategie maximin.
Dacă P2 alege strategia Bj ∈ B, se aşteaptă ca P1 să aleagă strategia
Ai ∈ A care îi asigură acestuia un câştig cât mai mare.
Fie
βj = max aij, j = 1, n .
1≤ i ≤ m

Dintre cele n strategii pure, P2 va alege acea strategie Bj care dă cel


mai mic câştig lui P1, adică cea care dă cea mai mică valoare lui βj. Notând
β = min βj = min max aij
j j i

β se va numi valoarea superioară a jocului şi se mai notează cu v G .

Strategia care asigură lui P2 o pierdere egală cu v G se numeşte


strategie minimax.
Exemplu
Fie jocul caracterizat de matricea:
B
A B1 B2 B3 B4
A1 0 1 -2 2
A2 1 0 3 2
A3 2 4 -3 3

Dacă P1 alege strategia A1 vizând câştigul a14 = 2, P2 poate alege


strategia B3, obligându-l pe P1 la un câştig a13 = -2 (adică o pierdere); când
P1 alege A2, P2 poate răspunde cu B2 şi P1 câştigă a12 = 0, iar când P1 alege
A3, P2 poate alege strategia B3 şi P1 câştigă atunci a31 = -3.
Să determinăm valorile inferioară şi superioară ale jocului.
Calculând αi = min aij, i = 1,3 , obţinem:
1≤ j≤ 4

α1 = min⎨0,1,-2,2⎬ = -2
Teoria jocurilor

α2 = min⎨1,0,3,2⎬ = 0
α3 = min⎨2,4,-3,3⎬ = -3
Valoarea inferioară a jocului este:
v G = max αi = max⎨-2,0,-3⎬ = 0 = α2.
1≤ i ≤ 3

Determinăm βj = max aij, j = 1,4 . Obţinem:


1≤ i ≤ 3

β1 = max⎨0,1,2⎬ = 2
β2 = max⎨1,0,4⎬ = 4
β3 = max⎨-2,3,-3⎬ = 3
β4 = max⎨2,3⎬ = 3.
Valoarea superioară a jocului este:
v G = min βj = min⎨2,4,3⎬ = 2 = β1.
1≤ j≤ 4

De aici rezultă că strategia maximin este A2, iar strategia minimax


este B1.
Observaţie: Calculele de mai sus pot fi simplificate prin organizarea
lor într-un tabel obţinut din cel iniţial, la care se adaugă coloana elementelor
αi şi linia elementelor βj, astfel:
B
A B1 B2 B3 B4 αi
A1 0 1 -2 2 -2
A2 1 0 3 2 0
A3 2 4 -3 3 -3
βj 2 4 3 3 0
2

Dacă într-un joc avem:


vG = vG = v
valoarea comună v se numeşte valoarea jocului. Elementul aij în care se
realizează această egalitate se numeşte punct şa, iar jocul respectiv se va
Modele matematice în economie

numi joc cu punct şa. Strategiile Ai şi Bj corespunzătoare punctului şa aij


formează o pereche de strategii minimax şi se vor numi strategii optime. Ele
determină valoarea jocului care este egală cu elementul corespunzător
punctului şa.
Exemplu
Fie jocul cu matricea:
B
A B1 B2 B3 B4 αi
A1 1 6 0 3 0
A2 3 3 5 6 3
A3 2 1 0 9 0
A4 3 4 5 7 3
βj 3 6 5 9 α=3
β=3

Observăm că α = v G = 3 = v G = β

Elementul a21 = 3 va fi punctul şa. Strategiile A2 şi B1 sunt strategii


optime, iar valoarea jocului este v = 3.
Observaţii:
1) Şi elementul a41 = 3 este punct şa, deci şi strategiile A4 şi B1 sunt
optime, iar valoarea jocului este tot v = 3. Deci punctul şa nu este
unic.
2) Abaterea de la strategia optimă poate duce la micşorarea
câştigului lui P1. De exemplu, dacă P1 alege A3 şi P2 îi răspunde
cu B3, câştigul său este a33 = 0, deci scade (tentaţia fiind aceea de
a obţine câştigul maxim, egal cu 9).
3) Elementul a21 = 3 este cel mai mic de pe linia şi cel mai mare de
pe coloana pe care se află. La fel a41 = 3. Aceasta justifică şi
denumirea de punct şa.
Teoria jocurilor

Exemplu
Fie jocul cu matricea:
B
A B1 B2 B3 B4 B5
A1 4 -1 2 1 3
A2 3 -2 0 -1 2
A3 1 2 0 -1 -2
A4 2 -6 3 1 0

Observăm că strategia A1 are toate câştigurile respectiv mai mari ca


ale strategiei A2. Jucătorul P1 care doreşte un câştig cât mai mare nu va
alege A2, pentru că poate câştiga mai mult prin A1 oricare ar fi strategia
aleasă de P2. Spunem că strategia A1 domină strategia A2, care este
dominată. A2 poate fi eliminată din joc.
Pentru jucătorul P2, strategia B4 domină strategiile B1 şi B3, acestea
din urmă conducând la pierderi mai mari pentru P2 decât B4. Deci se poate
renunţa la B1 şi B3 şi matricea A se reduce la:
⎛ −1 1 3 ⎞
⎜ ⎟
A = ⎜ 2 −1 − 2⎟ .
⎜− 6 1 0 ⎟⎠

În concluzie, o strategie pură domină o altă strategie pură dacă duce
la câştiguri mai bune decât aceasta din urmă. Un jucător nu trebuie să
folosească niciodată strategii dominate, acestea fiindu-i nefavorabile. Din
matricea A se elimină liniile care au toate elementele respectiv mai mici sau
egale cu ale altei linii şi coloanele ce au toate elementele respectiv mai mari
sau egale decât ale altei coloane. Acest principiu poartă numele de
principiul dominării strategiilor. Aplicarea lui conduce la reducerea
ordinului matricei A şi a volumului de calcule. Se poate demonstra că
Modele matematice în economie

eliminarea strategiilor dominate conduce la un joc care are aceeaşi valoare


ca şi jocul iniţial.
Să observăm că jocul „redus”, rezultat prin eliminarea strategiilor
dominate nu are punct şa, deci nici cel iniţial.

2.2 Jocuri fără punct şa

În jocurile fără punct şa, un jucător îşi poate majora câştigul folosind
altă strategie decât cea minimax dacă este informat asupra comportării
adversarului. Informaţii asupra comportamentului adversarului se pot obţine
prin repetarea partidelor, dacă acesta îşi menţine în toate partidele strategia
minimax. Un jucător nu trebuie să folosească mereu aceeaşi strategie şi nici
să folosească strategiile după o regulă ce poate fi descoperită de adversar.
Va fi necesară alternarea strategiilor pure, cu anumite probabilităţi.
În cele ce urmează vom vedea că, în cazul unui joc matriceal fără
punct şa, valoarea jocului o vom determina folosind un alt joc matriceal
asociat primului, numit joc mediat, notat Γ = (X, Y, ϕ), unde:
m
a) X = ⎨x ⎪ x = (x1, ..., xm), xi ≥ 0, i = 1, m , ∑x
i =1
i = 1⎬, cu

xi = P(Ai), i = 1, m reprezentând probabilitatea de alegere a


strategiei Ai, iar X este mulţimea strategiilor mixte pentru P1;
n
b) Y = ⎨y ⎪ y = (y1, ..., yn), yj ≥ 0, j = 1, n , ∑y
j =1
j = 1⎬ unde

yj = P(Bj), j = 1, n , este probabilitatea de alegere a strategiei Bj,


iar Y mulţimea strategiilor mixte pentru P2;
Teoria jocurilor

c) ϕ: X × Y → ℝ, cu:
m n
ϕ(x, y) = ∑∑ a x y
i =1 j =1
ij i j dacă P1 foloseşte strategia mixtă

x = (x1, ..., xm), iar P2 foloseşte strategia mixtă y = (y1, ..., yn).
Dacă introducem variabila aleatoare:
⎛a a 2 j L a mj ⎞
(x, j): ⎜⎜ 1 j ⎟ , valoarea medie a acesteia o notăm:
⎝ x1 x 2 L x m ⎟⎠
m
ϕ(x, j) = ∑a i =1
ij xi şi reprezintă câştigul mediu realizat de P1 când

foloseşte strategia mixtă x = (x1, ..., xm), iar P2 foloseşte strategia pură Bj.
Analog, variabila aleatoare:
⎛a a i 2 L a in ⎞
(i, y): ⎜⎜ i1 ⎟ va avea valoarea medie:
⎝ y1 y 2 L y n ⎟⎠
n
ϕ(i, y) = ∑a y
j =1
ij j şi reprezintă câştigul mediu realizat de P1 când

foloseşte strategia Ai iar P2 foloseşte strategia mixtă y = (y1, ..., yn).


Atunci, putem scrie că:
m n m n
ϕ(x, y) = ∑∑ a ijx i y j = ∑ x iϕ(i, y) = ∑ y jϕ( x, j) , de unde se vede
i =1 j=1 i =1 j=1

că ϕ(x, y) semnifică valoarea medie a jocului, care se mai scrie matriceal


astfel: ϕ(x, y) = xAyT.
Pentru jocul mediat Γ = (X, Y, ϕ), vom defini valoarea inferioară v Γ

şi valoarea superioară v Γ prin expresiile:


v Γ = max min ϕ(x, y)
x∈X y∈Y

v Γ = min max ϕ(x, y)


y∈Y x∈X
Modele matematice în economie

Prezentăm acum, cu sau fără demonstraţie, câteva rezultate din teoria


funcţiilor de mai multe variabile reale ce vor fundamenta principiile
matematice ale jocurilor matriceale.
Teorema 1

Fie X, Y două subspaţii ale unor spaţii liniare şi f: X × Y →ℝ. Dacă


există mărimile:
max min f(x, y) şi min max f(x, y), atunci
x∈X y∈Y y∈Y x∈X

max min f(x, y) ≤ min max f(x, y). (1)


x∈X y∈Y y∈Y x∈X

Demonstraţie:
Notăm g(x) = min f(x, y), (∀) x ∈ X şi h(y) = max f(x, y), (∀) y ∈Y.
y∈Y x∈X

Din definiţia extremelor, avem:


g(x) ≤ f(x, y), (∀) y ∈Y şi (∀)x ∈ X
Atunci:
max g(x) ≤ max f(x, y) = h(y), (∀) y ∈Y, şi deci:
x∈X x∈X

max g(x) ≤ min h(y).


x∈X y∈Y

Revenind la semnificaţiile lui g şi h, rezultă relaţia (1).


Consecinţă 1. Pentru orice joc matriceal G = (A, B, f) există v G şi

v G şi v G ≤ v G .

Demonstraţie:
Existenţa celor două valori, v G şi v G rezultă din faptul că f are o

mulţime finită de valori. Şi dacă în teorema 1 X = A, Y = B şi f (Ai, Bj) = aij

pentru orice Ai ∈ A şi Bj ∈ B, atunci relaţia (1) devine v G ≤ v G .


Teoria jocurilor

Teorema 2
În ipotezele teoremei 1, o condiţie necesară şi suficientă ca
max min f(x, y) = min max f(x, y). (2)
x∈X y∈Y y∈Y x∈X

este să existe x0 ∈ X şi y0 ∈ Y şi un număr w ∈ ℝ astfel încât:


f(x, y0) ≤ w ≤ f(x0, y), pentru orice x ∈ X şi y ∈ Y. (3)
Demonstraţie:
Necesitatea: Presupunem relaţia (2) adevărată. Fie x0 ∈ X punctul
care maximizează expresia min f(x, y) şi fie y0 ∈ Y punctul care
y∈Y

minimizează expresia max f(x, y), adică:


x∈X

min f(x0, y) = max min f(x, y)


y∈Y x∈X y∈Y

max f(x, y0) = min max f(x, y).


x∈X y∈Y x∈X

De aici şi din relaţia (2) rezultă că:


min f(x0, y) = max f(x, y0) = w.
y∈Y x∈X

De unde, evident f(x0, y) ≥ w şi f(x, y0) ≤ w, (∀) x ∈ X şi (∀) y ∈ Y,


adică relaţia (3).

Suficienţa: Presupunem că există x0 ∈ X, y0 ∈ Y şi w ∈ℝ astfel


încât relaţia (3) să fie adevărată.
Din f(x0, y) ≥ w, (∀) y ∈ Y, rezultă că şi min f(x0, y) ≥ w.
y∈Y

Analog, din f(x, y0) ≤ w, (∀) x ∈ X, rezultă că şi max f(x, y0) ≤ w,


x∈X

deci max f(x, y0) ≤ w ≤ min f(x0, y), (∀) x ∈ X, (∀) y ∈ Y.


x∈X y∈Y

Dar min max f(x, y) ≤ max f(x, y0) ≤ w


y∈Y x∈X x∈X
Modele matematice în economie

max min f(x, y) ≥ min f(x0, y) ≥ w


x∈X y∈Y y∈Y

şi de aici, în baza tranzitivităţii relaţiei „≤”, rezultă că:


min max f(x, y) ≤ max min f(x, y).
y∈Y x∈X x∈X y∈Y

Această relaţie, împreună cu relaţia (1), implică


w = max min f(x,y) = min max f(x,y), fapt ce încheie demonstraţia.
x∈X y∈Y y∈Y x∈X

Definiţie: Fie f: X × Y →ℝ. Punctul (x0, y0) ∈ X × Y este punct şa


pentru f dacă:
f(x, y0) ≤ f(x0, y0) ≤ f(x0, y), (∀) x ∈ X şi (∀) y ∈ Y.
Consecinţă 2: Dacă G = (A, B, fG) este un joc matriceal m × n, atunci

o condiţie necesară şi suficientă ca v G = v G = w este ca fG să admită un

punct şa.
Demonstraţie:
Se aplică teorema 2, în care X = A, Y = B, fG(Ai, Bj) = aij, i = 1, m ,

j = 1, n , luând w = fG(Aio, Bj0).


Condiţia necesară şi suficientă de existenţă a punctului şa este să
existe perechea de strategii pure Aio, Bjo astfel încât:
aiojo = max min aij = min max aij
i j j i

adică elementul aiojo este cel mai mic din linia i0 şi în acelaşi timp cel mai
mare din coloana j0.
Strategiile A i 0 şi B j0 corespunzătoare punctului şa sunt strategii

optime.
Teoria jocurilor

Teorema 3. (teorema fundamentală de minimax)


Fie un joc G = (A, B, f) de două persoane, caracterizat de matricea

jocului A = (aij), i = 1, m , j = 1, n şi fie Γ = (X, Y, ϕ) jocul mediat


corespunzător. Atunci există expresiile:
v Γ = max min ϕ(x, y) şi v Γ = min max ϕ(x, y) şi v Γ = v Γ .
x∈X y∈Y y∈Y x∈X

Demonstraţie:
Să demonstrăm existenţa valorilor v Γ şi v Γ .

Pentru orice y = (y1, ..., yn) ∈ Y funcţia


m n
ϕ(x, y) = ∑∑ a x y
i =1 j =1
ij i j este funcţie de x = (x1, ..., xm) ∈X,

continuă şi liniară. Într-adevăr:


n n
ϕ(x, y) = x1 ∑ a1 j y j + ... + x m ∑ a mj y j , deci este mărginită şi îşi atinge
j =1 j =1

marginile pe X.
Deci există max ϕ(x, y) pentru orice y ∈Y, iar această funcţie este
x∈X

liniară în y ∈ Y, deci este şi continuă. Cum Y este o parte închisă a lui ℝn,
rezultă că există max min ϕ(x, y).
x∈X y∈Y

Analog se arată că există min max ϕ(x, y) şi existenţa e demonstrată.


y∈Y x∈X

Din teorema 1, relaţia (1) putem scrie că


max min ϕ(x, y) ≤ min max ϕ(x, y) (4)
x∈X y∈Y y∈Y x∈X

adică v Γ ≤ v Γ .
Modele matematice în economie

Pentru demonstrarea inegalităţii inverse dăm, fără demonstraţie:


Lema 1 (lema fundamentală a dualităţii):
Dacă A = (aij), i = 1, m , j = 1, n şi x = (x1, ..., xm), y = (y1, ..., yn)
îndeplinesc condiţiile:
m n
xi ≥ 0, ∑x
i =1
i = 1, yj ≥ 0, ∑y
j=1
j = 1, atunci există o pereche de

asemenea vectori x, y pentru care numai una din următoarele situaţii este
adevărată:
m
i) ∑a x
i =1
ij i ≥ 0, j = 1, n ;

n
ii) ∑a
j=1
ij y j ≤ 0, i = 1, m .

Aplicând această lemă pentru matricea jocului A, dacă are loc prima
situaţie (i), înseamnă că există x = (x1, ..., xm) astfel încât a1jx1 +...+amjxm ≥0,

(∀) j = 1, n , de unde:
n
ϕ(x, y) = ∑ (a
j=1
1j x 1 + ... + a mj x m ) y j ≥ 0, (∀) y ∈ Y, deci

min ϕ(x, y)≥0, de unde rezultă că şi max min ϕ(x, y)≥0.


y∈Y x∈X y∈Y

Dacă situaţia (ii) din lemă este adevărată, există y = (y1, ..., yn) ∈ Y
astfel încât
ai1y1 + ... + ainyn ≤ 0, i = 1, m , de unde:
m
ϕ(x, y) = ∑ (a
i =1
y + ... + a in y n ) x i ≤ 0, (∀) x ∈ X, deci şi
i1 1

max ϕ(x, y) ≤ 0, de unde rezultă că şi min max ϕ(x, y) ≤ 0.


x∈X y∈Y x∈X
Teoria jocurilor

Cum numai una dintre cele două situaţii din lemă are loc, niciodată
nu se va verifica relaţia
max min ϕ(x, y) < 0 < min max ϕ(x, y) (5)
x∈X y∈Y y∈Y x∈X

Fie Gk = (A, B, fk) având matricea Ak = (aij – k); i = 1, m , j = 1, n ,

k ∈ℝ şi jocul mediat corespunzător Γk = (X, Y, ϕk), ϕk fiind câştigul mediu


în jocul mediat cu matricea Ak, adică:
m n m n m n
ϕk(x, y) = ∑∑ (a ij − k )x i y j =∑ ∑ a ijx i y j − k ∑∑ x i y j .
i =1 j=1 i =1 j=1 i =1 j=1

Cum ∑∑ x y
i j
i j = 1, obţinem:

ϕk(x, y) = ϕ(x, y) – k (6)


Pentru jocul Γk, rezultă din (5) că nu poate avea loc inegalitatea:
max min ϕk(x, y) < 0 < min max ϕk(x, y)
x∈X y∈Y y∈Y x∈X

sau ţinând seama de (6) nu poate avea loc relaţia


max min ϕ(x, y) – k < 0 < min max ϕ(x, y) – k
x∈X y∈Y y∈Y x∈X

care se mai scrie:


max min ϕ (x, y) < k < min max ϕ(x, y), (∀) k ∈ℝ.
x∈X y∈Y y∈Y x∈X

Negarea acestei ultime relaţii implică:


max min ϕ(x, y) ≥ min max ϕ(x, y) sau
x∈X y∈Y y∈Y x∈X

vΓ ≥ vΓ , care, împreună cu (4), dau vΓ = vΓ .

Definiţie. Valoarea unui joc matriceal G = (A, B, f) cu f(A × B) = A,

A = (aij), i = 1, m , j = 1, n fără punct şa este dată de valoarea vΓ = v Γ = v a

jocului mediat Γ = (X, Y, ϕ) asociat lui.


Modele matematice în economie

Consecinţă 3: Orice joc matriceal mediat are o valoare şi deci şi o


soluţie. În mulţimea strategiilor X şi Y există cel puţin o pereche de strategii
mixte x0, y0 pentru care:
ϕ(x0, y0) = max min ϕ(x, y) = min max ϕ(x, y).
x∈X y∈Y y∈Y x∈X

Teorema 4 [6]
Dacă G = (A, B, f) şi Γ(X, Y, ϕ) jocul mediat asociat, atunci:

v G ≤ vΓ ≤ vΓ ≤ v G

Teorema 5 [6]
Asupra matricei A = (aij) a unui joc se pot efectua următoarele
operaţii:
a) dacă se permută liniile (coloanele) între ele, valoarea jocului nu se
schimbă şi nici probabilităţile de folosire a strategiilor de către
jucătorul P1 (respectiv P2);
b) dacă la fiecare element aij din matricea A a unui joc matriceal de
valoare v se adaugă acelaşi număr real k, atunci strategiile mixte
optime rămân neschimbate, iar valoarea jocului devine v’ = v + k;
c) dacă toate elementele matricei A dintr-un joc matriceal de valoare
v se înmulţesc cu acelaşi număr k > 0, atunci strategiile mixte
optime rămân neschimbate, iar valoarea jocului devine v’ = kv.

2.3 Rezolvarea jocurilor matriceale

Teorema 3 (teorema minimax) asigură existenţa strategiilor optime


în jocuri de două persoane cu sumă nulă. Ne preocupă să găsim modul cum
Teoria jocurilor

pot fi calculate aceste strategii. În cele ce urmează, vom prezenta câteva


metode pentru soluţia unor jocuri matriceale.

2.3.a Jocuri 2 × 2

Considerăm jocul matriceal cu:


⎛a a 12 ⎞
A = ⎜⎜ 11 ⎟⎟ .
⎝ a 21 a 22 ⎠
Dacă jocul are punct şa, rezolvarea sa e banală. Presupunem că jocul
nu are punct şa. Atunci strategiile optime x = (x1, x2) şi y = (y1, y2) vor avea
toate componentele pozitive. Valoarea jocului v este:
v = ϕ(x, y) = a11x1y1 + a12x1y2 + a21x2y1 + a22x2y2
şi se mai scrie:
x1(a11y1 + a12y2) + x2(a21y1 + a22y2) = v (7)
Cum y este strategie optimă, fiecare expresie din paranteze este cel
mult egală cu v. Dacă presupunem că una e strict mai mică decât v, de
exemplu:
a11y1 + a12y2 < v
a21y1 + a22y2 ≤ v
cum x1 > 0 şi x1 + x2 = 1 ar rezulta că membrul stâng din (7) este mai mic ca
v. Deci va trebui ca:
a11y1 + a12y2 = v
a21y1 + a22y2 = v.
Raţionând analog se obţine:
a11x1 + a21x2 = v
a12x1 + a22x2 = v.
Modele matematice în economie

Sau matriceal:
⎛ v⎞
AyT = ⎜⎜ ⎟⎟ şi xA = (v, v). (8)
⎝ v⎠
Notând J = (1, 1) şi ţinând seama că x1 + x2 = 1 şi y1 + y2 = 1, găsim
formulele de calcul pentru x, y şi v.
Dacă A este nesingulară, din (8) avem:
xA = vJ şi x = vJA-1. (8’)
Dar x1 + x = 1 este echivalentă cu xJT = 1.
În (8’), înmulţind cu JT, avem:
vJA-1JT = xJT = 1 de unde:
1
v= .
JA −1J T
Atunci, din (8’) vom avea:
JA −1
x= .
JA −1J T
Prima relaţie din (8) se mai scrie: AyT = vJT, de unde:
A −1J T
yT = A-1(vJT) = .
JA −1J T
Dacă A este singulară (A-1 nu există), echivalentele formulelor de
mai sus vor fi ([16]):
JA * A * JT |A|
x= T
; y T
= T
; v= , (9)
JA * J JA * J JA * J T
unde A* este matricea adjunctă a lui A, ⎪A⎪ determinantul lui A şi J = (1,1).
Aceste formule se verifică şi când A este inversabilă.
Teoria jocurilor

Exemplu
Să se determine soluţia jocului matriceal:
⎛ 2 1⎞
A = ⎜⎜ ⎟⎟ .
⎝ 0 3⎠
Rezolvare
⎛ 3 − 1⎞
Jocul nu are punct şa. Matricea A* = ⎜⎜ ⎟⎟ , ⎪A⎪ = 6,
⎝0 2 ⎠
⎛ 3 − 1⎞ ⎛ 3 − 1⎞ ⎛1⎞ ⎛ 2 ⎞
JA* = (1,1) ⎜⎜ ⎟⎟ = (3, 1); A*JT = ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ ;
⎝ 0 2 ⎠ ⎝ 0 2 ⎠ ⎝1⎠ ⎝ 2 ⎠
⎛ 2⎞
JA*JT = (1, 1) ⎜⎜ ⎟⎟ = 4.
⎝ 2⎠
Introducând rezultatele obţinute în (9) avem:
⎛3 1⎞ ⎛1 1⎞ 3
x = ⎜ , ⎟, y = ⎜ , ⎟ , v = .
⎝ 4 4⎠ ⎝ 2 2⎠ 2
Observaţie: Metoda de mai sus poate fi aplicată în rezolvarea
matriceală a jocurilor, în care dacă notăm matricea câştigurilor cu C = (cij), i
= 1, m , j = 1, n , pentru jocul Γ = (X, Y, f), soluţia şi valoarea jocului se
determină ([9], [21]) cu ajutorul formulelor:
JrA * J r (A*)T |A|
x= T
, y = * T
, v= (9’)
JrA * Jr JrA Jr J r A * J Tr
În relaţiile (9’) avem:
- A o matrice nesingulară a lui C, de ordinul r, 2 ≤ r ≤ min(m, n);
- ⎪A⎪ este determinantul matricei A;
- Jr = (1, ..., 1), matrice de ordinul 1 × r;
Modele matematice în economie

Determinarea soluţiei se face astfel:


a) se caută toate submatricele nesingulare A, pornind de la
r = min(m,n);
b) se rezolvă jocurile corespunzătoare matricelor de la a), care
admit numai strategii pozitive;
c) în x şi y se completează cu zerouri componentele
corespunzătoare liniilor şi coloanelor din C care nu intră în A,
obţinând strategiile x0 şi y0;
d) se verifică condiţiile corespunzătoare relaţiilor (8), date de
criteriul Neumann şi anume x0A = vJ şi AyT = vJT.
Dacă aceste relaţii sunt îndeplinite x0 şi y0 sunt strategii optime ale
jocului Γ, iar v este valoarea jocului.

2.3.b Jocuri 2 × n şi m × 2

În acest caz presupunem că cel puţin un jucător posedă numai două


strategii pure. Fie P1 jucătorul ce are numai două strategii pure, adică
analizăm cazul 2 × n. Jocurile m × 2 se tratează într-un mod similar.
Dacă matricea jocului este:
⎛ a ...a ⎞
A = ⎜⎜ 11 1n ⎟⎟
⎝ a 21 ...a 2 n ⎠
şi x = (x1, x2) e strategia jucătorului P1, atunci acesta urmăreşte să
maximizeze funcţia v(x) – valoarea jocului.
Teoria jocurilor

Modelul matematic al jocului pentru P1 este:


a11x1 + a21x2 ≥ v


a1nx1 + a2nx2 ≥ v
x1 + x2 = 1
x1, x2 ≥ 0
şi poate fi adus la forma matematică a unui model de programare liniară
având necunoscutele x1, x2 şi v, astfel:
[max]f = v
a11x1 + a21x2 – v ≥ 0


a1nx1 + a2nx2 – v ≥ 0
x1 + x2 = 1
x1, x2 ≥ 0, v – oarecare.
Exemplu
Să se determine strategia optimă a jucătorului P1 în jocul definit de
matricea:
⎛ − 2 4 − 4⎞
A = ⎜⎜ ⎟⎟ .
⎝ 8 − 6 16 ⎠
Rezolvare
Strategiile lui P1 verifică sistemul:
-2x1 + 8x2 ≥ v
4x1 – 6x2 ≥ v
-4x1 + 16x2 ≥ v
x1 +x2 = 1
x1, x2 ≥ 0, v – oarecare.
Modele matematice în economie

Forma matematică a modelului de programare liniară în


necunoscutele x1, x2 şi v va fi:
[max]f = v
-2x1 + 8x2 – v ≥ 0
4x1 – 6x2 – v ≥ 0
-4x1 + 16x2 – v ≥ 0
x1 +x2 = 1
x1, x2 ≥ 0, v – oarecare.
Cum x1 = 1 – x2, x1, x2 ∈ [0,1], modelul de mai sus devine:
[max]f = v
10x2 – v ≥ 2
10x2 + v ≤ 4
20x2 – v ≥ 4
x2 ∈ [0,1], v – oarecare.
Rezolvăm grafic această problemă şi obţinem:
v = -2+10x2

v
4
v = -4+20x2

1 M(0,3; 1)

0 1 x2

-1

v = 4-10x2
-2

-4
Teoria jocurilor

Regiunea haşurată conţine mulţimea punctelor ce satisfac restricţiile


modelului de programare liniară. Punctul M aflat la intersecţia dreptelor
generate de restricţiile 1 şi 2 (deci corespunzătoare coloanelor 1 şi 2 din A)
are abcisa x2 = 0, 3 şi ordonata v = 1. Atunci strategia lui P1 este x = (x1, x2),
unde x2 = 0, 3 şi x1 = 1 – x2 = 0,7 şi valoarea jocului este v = 1.
Observaţie: Aceste valori pot fi obţinute cu formulele (9) pentru
jocul matriceal 2 × 2 format din coloanele 1 şi 2 ale matricei A. Fie
⎛− 2 4 ⎞
A0 = ⎜⎜ ⎟⎟ . Într-adevăr,
⎝ 8 − 6⎠
⎛ − 6 − 4⎞ ⎛ − 6 − 4⎞
A *0 = ⎜⎜ ⎟⎟ , ⎪A0⎪ = - 20, JA*0 = (1,1)⎜⎜ ⎟⎟ = (-14, -6).
⎝ − 8 − 2⎠ ⎝ − 8 − 2⎠
⎛ − 6 − 4 ⎞⎛1⎞ ⎛ − 10 ⎞ ⎛ − 10 ⎞
A*0 J T = ⎜⎜ ⎟⎟⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ ; JA *0 JT = (1,1) ⎜⎜ ⎟⎟ = - 20.
⎝ − 8 − 2 ⎠⎝1⎠ ⎝ − 10 ⎠ ⎝ − 10 ⎠
JA*0 1
x= * T
= − (-14, -6) = (0,7; 0,3).
JA 0 J 20

| A 0 | − 20
v= = = 1.
JA *0 J T − 20

A*0 J T 1 ⎛ − 10 ⎞ ⎛ 0,5 ⎞
yT = = − ⎜⎜ ⎟ = ⎜ ⎟ de unde y = (0,5; 0,5; 0).
* T
JA 0 J 20 ⎝ − 10 ⎟⎠ ⎜⎝ 0,5 ⎟⎠
Am obţinut astfel şi strategia optimă a lui P2.

2.3.c Rezolvarea jocurilor matriciale prin programare liniară

Fie jocul G = (A, B, f) cu matricea A = (aij), i = 1, m , j = 1, n de


valoare v, având jocul mediat corespunzător Γ = (X, Y, ϕ).
Modele matematice în economie

Dacă jucătorul P1 foloseşte strategiile Ai, cu probabilităţile xi,


i = 1, m , poate spera la un câştig egal cel puţin cu valoarea v a jocului,

pentru orice strategie Bj, j = 1, n , a lui P2.


Putem scrie sistemul de inecuaţii:
a11x1 + ... + am1xm ≥ v
a12x1 + ... + am2xm ≥ v

(I) ∶
a1nx1 + ... + amnxm ≥ v
x1 + ... + xm = 1
xi ≥ 0; i = 1, m .

Dacă jucătorul P2 foloseşte strategiile Bj cu probabilităţile yj, j = 1, n ,


el se aşteaptă la o pierdere cel mult egală cu valoarea v a jocului şi putem
scrie sistemul de inecuaţii:
a11y1 + ... + a1nyn ≤ v
a21y1 + ... + a2nyn ≤ v

(II) ∶
am1y1 + ... + amnyn ≤ v
y1 + ... + yn = 1
yj ≥ 0; j = 1, n .

Sistemul (I) corespunde condiţiei ϕ(x, j) ≥ v, j = 1, n , iar sistemul (II)

corespunde condiţiei ϕ(i, y) ≤ v pe care trebuie să le verifice strategiile


x = (x1, ..., xm) şi y = (y1, ..., yn) pentru a fi optime.
Teoria jocurilor

Pentru a transforma cele două sisteme în modele de programare


liniară este necesar ca valoarea v a jocului să fie pozitivă. Deci vom
presupune v > 0 (în caz contrar se face modificarea matricei A în A = ( a ij )

cu a ij = aij + k > 0, (∀)i = 1, m , j = 1, n şi k > 0.

xi yj
Notăm Xi = , i = 1, m , Yj = , j = 1, n .
v v
Condiţiile ca xi şi respectiv yj să fie probabilităţi, devin:
1
X1 + ...+ Xm =
v
1
Y1 + ...+ Yn =
v
Deoarece jucătorul P1 urmăreşte obţinerea celei mai mari valori a
1
câştigului v, deci a celei mai mici valori a lui , el îşi propune să obţină
v
minf = X1 + ... + Xm.
Jucătorul P2 urmăreşte obţinerea celei mai mici pierderi v, adică cea
1
mai mare valoare a lui , deci îşi propune să obţină maxg = Y1 + ...+ Yn.
v
Astfel sistemele (I) şi (II) corespunzătoare celor doi jucători se pot
scrie ca un cuplu de probleme duale de programare liniară şi anume:
1
[min]f = = X1 + ...+ Xm
v
a11X1 + ... + am1Xm ≥ 1

(I) ∶
a1nX1 + ... + amnXm ≥ 1

Xi ≥ 0, i = 1, m
Modele matematice în economie

1
[max]g = = Y1 + ...+ Yn
v
a11Y1 + ... + a1nYn ≤ 1

(II) ∶
am1Y1 + ... + amnYn ≤ 1

Yj ≥ 0, j = 1, n
Prin rezolvarea uneia dintre cele două duale se obţin strategiile mixte
optime ale ambilor jucători precum şi valoarea jocului v:
1 1
v= = .
[min]f [max]g
Este de preferat rezolvarea lui II deoarece implică un volum mai mic
de calcule.
Exemplu
O firmă A doreşte să lanseze pe piaţă un anumit tip de produs în trei
sortimente A1, A2, A3. Concurenta ei, firma B, prezintă produsul în
sortimentele B1, B2, B3. Se cunoaşte, din sondajele făcute că dacă
cumpărătorii trebuie să aleagă între sortimentul Ai, i = 1,3 şi Bj, j = 1,3 , ei
preferă fie produsele firmei A (situaţie notată cu 1), fie pe cele ale firmei B
(situaţie notată cu -1), fie sunt indiferenţi (situaţie notată cu 0), conform
tabelului următor:
Bj
B1 B2 B3
Ai
A1 1 -1 0
A2 -1 1 -1
A3 0 1 1

Să se determine strategia firmei A în faţa concurentei B.


Teoria jocurilor

Rezolvare
Fie x1, x2, x3 probabilităţile corespunzătoare celor 3 strategii pure ale
firmei A şi y1, y2, y3 probabilităţile corespunzătoare strategiilor firmei B.
Determinăm valoarea inferioară α şi valoarea superioară β a jocului.
y
y1 y2 y3 αi
x
x1 1 -1 0 -1
x2 -1 1 -1 -1
x3 0 1 1 0
0
βj 1 1 1
1

α = max αi = 0 este valoarea inferioară a jocului şi


β = min βj = 1 este valoarea superioară a jocului.
Deci jocul nu are punct şa, iar valoarea v a jocului are proprietatea că
0 ≤ v ≤ 1.
Modelele duale de programare liniară vor fi:
x1 + x2 + x3 =1
x1 – x2 ≥v
(I) -x1 + x2 + x3 ≥ v
-x2 + x3 ≥ v

xi ≥ 0, i = 1,3

xi 1
sau cu notaţiile Xi = , i = 1,3 şi [min]f =
v v
Modele matematice în economie

1
[min]f = = X1 + X2 + X3
v
X1 – X2 ≥ 1
(I) -X1 + X2 + X3 ≥ 1
-X2 + X3 ≥ 1
Xi ≥ 0, i = 1,3

pentru firma A, iar pentru firma B:


y1 + y2 + y3 =1
y1 – y2 ≤v
(II) -y1 + y2 - y3 ≤ v
y2 + y3 ≤ v

yj ≥ 0, j = 1,3

yj 1
Cu notaţiile Yj = , j = 1,3 şi [max]g = , avem:
v v
1
[max]g = = Y1 + Y2 + Y3
v
Y1 – Y2 ≤ 1
(II) -Y1 + Y2 - Y3 ≤ 1
Y2 + Y3 ≤ 1
Yj ≥ 0, j = 1,3

Se rezolvă prin algoritmul simplex al doilea model, aducând


problema la forma standard.
Teoria jocurilor

Y1 – Y2 + Y4 = 1
-Y1 + Y2 – Y3 + Y5 = 1
Y2 + Y3 + Y6 = 1
Yj ≥ 0, j = 1,6
1
[max]g = = Y1 + Y2 + Y3 + 0(Y4 + Y5 + Y6)
v
1 1 1 0 0 0
B CB YB θ
a1 a2 a3 a4 a5 a6
←a4 0 1 1↓ -1 0 1 0 0 1
a5 0 1 -1 1 -1 0 1 0 -
a6 0 1 0 1 1 0 0 1 -
gj 0 0 0 0 0 0 0
∆j = cj - gj 1 1 1 0 0 0
a1 1 1 1 -1 ↓ 0 1 0 0 -
a5 0 2 0 0 -1 1 1 0 -
←a6 0 1 0 1 1 0 0 1 1
gj 1 1 -1 0 1 0 0
∆j = cj - gj 0 2 1 -1 0 0
a1 1 2 1 0 1 1 0 1
a5 0 2 0 0 -1 1 1 0
a2 1 1 0 1 1 0 0 1
gj 3 1 1 2 1 0 2
∆j = cj - gj 0 0 -1 -1 0 -2

[max]g = 3 = [min]f
Y1 = 2, Y2 = 1, Y3 = 0
X1 = 1, X2 = 0, X3 = 2
1 1
Atunci v = = .
[max]g 3
1 2 1 1 1
y1 = vY1 = ⋅ 2 = , y2 = vY2 = ⋅ 1 = , y3 = vY3 = ⋅ 0 = 0
3 3 3 3 3
1 1 1 1 2
x1 = vX1 = ⋅ 1 = , x2 = vX2 = ⋅ 0 = 0, x3 = vX3 = ⋅ 2 = .
3 3 3 3 3
Firma A va avea strategia mixtă
Modele matematice în economie

1 2
x = ( , 0, ), adică va trebui să producă 33, 33% produse din
3 3
primul sortiment iar restul 66,66% din al treilea sortiment. Acest plan de
1
producţie îi asigură firmei A un câştig, fără nici un risc, de în vreme ce
3
1
concurenta ei, firma B, va avea o pierdere de .
3
În concluzie, în rezolvarea unui joc matricial se parcurg următorii
paşi:
Pasul 1. Se determină valoarea inferioară α şi valoarea superioară β
a jocului:
- dacă α = β, jocul are punct şa, se determină strategiile
pure şi valoarea jocului;
- dacă α < β, jocul nu are punct şa; vor trebui determinate
strategiile mixte optime şi valoarea jocului.
Pasul 2. Se elimină strategiile dominate.
Pasul 3. Ne asigurăm ca valoarea v a jocului să fie un număr pozitiv,
ştiind că v ∈ [α, β].
Pasul 4. Scriem modelul de programare liniară pentru jucătorul P2 şi
rezolvăm prin algoritmul simplex problema din care citim
[max]g, Y1,...,Yn şi X1, ..., Xm.
1
Pasul 5. Determinăm: v = , xi = vXi, i = 1, m şi yj = vYj,
[max]g

j = 1, n , adică soluţia optimă a problemei.


Observaţie: Dacă matricea jocului este de forma 2 × 2 sau 2 × n, în
pasul 3 putem alege şi alte metode în afara algoritmului simplex, cum ar fi
cele prezentate la 2.3.a şi 2.3.b.
Teoria jocurilor

3. Jocuri contra naturii

Până acum ne-am ocupat de jocuri în care alegerea strategiilor era


determinată de matricea A a câştigurilor primului jucător P1. Sunt situaţii în
care riscurile cu care se iau hotărâri nu pot fi cunoscute, deoarece jucătorul
P2 nu acţionează raţional. Un astfel de jucător poate fi considerată natura, de
unde şi denumirea de jocuri contra naturii. De analiza unor astfel de situaţii
se ocupă teoria deciziilor.
În cele ce urmează vom prezenta unele criterii de alegere a deciziei
jucătorului P1 (numit şi statistician) în jocurile contra naturii (numite şi
jocuri în caz de incertitudine). Menţionăm că atitudinea faţă de joc, diferită
de la o persoană la alta, face ca în teoria deciziilor să nu existe criterii
universal valabile. Aplicarea criteriilor poate conduce la rezultate diferite.
Alegerea strategiei ar putea fi dată de rezultatul aplicării mai multor criterii.
Vom presupune că statisticianul – jucătorul P1, dispune de m
strategii pure A1, ..., Am, iar natura are n stări B1, ..., Bn.
Fie matricea A = (aij), i = 1, m , j = 1, n , unde aij este câştigul lui P1
când alege strategia Ai, iar natura se află în starea Bj.

Criteriul lui Hurwicz (criteriul optimismului)

Optimismul jucătorului P1 se defineşte ca un număr α ∈ [0,1]. Se


determină numerele reale:
mi = min ⎨aij⎬ şi Mi = max ⎨aij⎬, i = 1, m .
j j

Fiecărei strategii Ai îi asociem expresia:


αMi + (1 - α)mi, i = 1, m .
Modele matematice în economie

Strategia optimă va fi cea care corespunde la:


max [αMi + (1 - α)mi]
i

În folosirea acestui criteriu trebuie să se definească în prealabil


optimismul jucătorului, adică numărul α ∈ [0, 1].
Exemplu
Se consideră jocul contra naturii a cărui matrice a câştigurilor lui P1
în orice strategie a sa Ai, i = 1,4 şi în orice stare Bj, j = 1,4 a naturii este:

B1 B2 B3 B4
A1 2 4 3 3
A2 3 2 3 2
A3 1 5 2 1
A4 3 3 2 3

Să se determine în funcţie de α strategia optimă a lui P1.


2
Pentru α = care este strategia optimă?
3

Rezolvare
Ataşăm matricei date coloanele elementelor: mi, Mi şi
αMi + (1 - α)mi, unde mi este respectiv cel mai mic, iar Mi este cel mai mare
număr de pe linia respectivă. Obţinem astfel:

B1 B2 B3 B4 mi Mi αMi+(1-α)mi
A1 2 4 3 3 2 4 2α+2
A2 3 2 3 2 2 3 α+2
A3 1 5 2 1 1 5 4α+1
A4 3 3 2 3 2 3 α+2
Teoria jocurilor

Ca să determinăm max [αMi + (1 - α)mi], ştiind că α ∈ [0,1],


i

observăm că α + 2 ≤ 2α + 2, (∀)α ∈ [0,1]. Merită studiate cazurile:


1
a) 4α + 1 < α + 2, de unde α < ;
3
1 1
b) α + 2 ≤ 4α + 1 < 2α + 2, de unde ≤α< ;
3 2
1
c) 2α + 2 ≤ 4α + 1, de unde α ≥ .
2
1
Deci pentru α ∈ [0, ), 2α + 2 este cea mai mare valoare şi cum ea
3
corespunde strategiei A1, aceasta este strategia optimă.
1 1
Pentru α ∈ [ , ), tot 2α + 2 este valoarea maximă deci A1 e
3 2
strategie optimă.
1
Pentru α ∈ [ , 1], 4α + 1 e valoarea maximă şi A3 este strategia
2
optimă.
2 1
În particular α = ∈ [ , 1], deci A3 este strategia optimă.
3 2

Criteriul Bayes - Laplace

În cazul acestui criteriu se va presupune că stările naturii sunt egal


probabile. Şi cum numărul lor este n, probabilitatea ca natura să se afle în
1
starea Bj este , (∀) j = 1, n .
n
Modele matematice în economie

Dacă jucătorul P1 va alege strategia Ai, câştigul său va fi


n
1
n
∑a
j=1
ij , care este valoarea medie a variabilei aleatoare

discrete cu repartiţia:
⎛ a i1 a i 2 L a in ⎞
⎜1 1 1 ⎟⎟ .
⎜ L
⎝n n n⎠
P1 va alege strategia pentru care câştigul său mediu este maxim:
⎧1 n ⎫
max ⎨ ∑ a ij ⎬ .
1≤ i ≤ m n
⎩ j=1 ⎭
Observaţia 1:
Dacă se cunosc totuşi probabilităţile diferitelor stări ale naturii
respectiv y1, ..., yn, deci strategia y = (y1, ..., yn) cu yj ≥ 0, j = 1, n şi
n

∑y
j=1
j =1, câştigul mediu al statisticianului P1 când foloseşte strategia Ai va

fi, conform formulei din paragraful 2.2:


n
ϕ(i, y) = ∑a y
j =1
ij j , iar câştigul mediu va fi maxim pentru strategia

corespunzătoare valorii:
max ϕ(i, y).
1≤ i ≤ m

Observaţia 2:
Criteriul lui Laplace introduce toate neajunsurile valorii medii. Dacă
estimările au fost făcute grosolan apar erori în apreciere, ce vor duce la
decizii greşite. Criteriul devine uneori inacceptabil când elementele jocului
sunt foarte dispersate.
Teoria jocurilor

Exemplu
Pentru jocul din exemplul precedent să se determine strategia optimă
a lui P1 în cazurile:
a) când stările naturii sunt egal probabile;
b) când probabilităţile ca natura să se afle în stările ei sunt
respectiv:
1 2 4 2
, , , .
9 9 9 9
Rezolvare
1 4
a) Ataşăm matricei jocului coloana ∑ a ij :
n j=1

1 4
B1 B2 B3 B4 ∑ a ij
n j=1
A1 2 4 3 3 1
⋅12
4
1
A2 3 2 3 2 ⋅10
4
1
A3 1 5 2 1 ⋅9
4
A4 3 3 2 3 1
⋅11
4

1 4 1
Deci max ⎨
1≤i ≤ 4

4 j=1
a ij ⎬ este
4
⋅12 ce corespunde strategiei A1 deci

aceasta este strategia optimă, după criteriul Laplace.


b) Calculăm pentru fiecare strategie Ai valoarea expresiei date de
ϕ(i, y), i = 1,4 . Obţinem:
1 2 4 2 1
ϕ(1, y) = ⋅2 + ⋅4 + ⋅ 3 + ⋅3 = ⋅28;
9 9 9 9 9
Modele matematice în economie

1 2 4 2 1
ϕ(2, y) = ⋅3 + ⋅2 + ⋅ 3 + ⋅2 = ⋅23;
9 9 9 9 9
1 2 4 2 1
ϕ(3, y) = ⋅1 + ⋅5 + ⋅ 2 + ⋅1 = ⋅21;
9 9 9 9 9
1 2 4 2 1
ϕ(4, y) = ⋅3 + ⋅3 + ⋅ 2 + ⋅3 = ⋅23.
9 9 9 9 9
1
Cea mai mare valoare este ⋅ 28 şi corespunde lui ϕ(1, y), deci A1
9
este strategia optimă.

Criteriul lui Savage (criteriul regretelor)

Savage compară rezultatul deciziei în cazul necunoaşterii stării


naturii cu cel care s-ar obţine dacă s-ar cunoaşte această stare. Diferenţa
dintre câştigul realizat când se ia decizia fără a cunoaşte stările naturii şi cel
realizat dacă se cunosc acestea reprezintă regretul sau ce s-ar fi câştigat dacă
P1 ar fi cunoscut stările naturii.
Pornind de la matricea A = (aij), i = 1, m , j = 1, n , se formează o nouă
matrice R = (rij), numită matricea regretelor, unde elementul:
rij = max akj – aij, i = 1, m , j = 1, n , adică rij este dat de diferenţa
1≤ k ≤ m

dintre cel mai mare element de pe coloana j şi elementul aij.


Se obţine astfel un nou joc caracterizat de matricea R care va fi tratat
după criteriul minimax. P1 va alege strategia pe linia căreia se obţine:
min ⎨ max rij⎬, adică linia pe care cel mai mare regret este minim.
1≤ i ≤ m 1≤ j≤ n

Exemplu
Pentru acelaşi joc din ultimele două exemple, aplicând criteriul
regretelor, să se determine strategia ce va fi aleasă de P1.
Teoria jocurilor

Rezolvare
Se determină mai întâi matricea regretelor ale cărei elemente de pe o
coloană se obţin scăzând din cel mai mare element al coloanei fiecare
element al acesteia. Se obţine:

B1 B2 B3 B4 max rij
j

A1 1 1 0 0 1
A2 0 3 0 1 3
A3 2 0 1 2 2
A4 0 2 1 0 2

Atunci min ⎨ max rij⎬ = min⎨1, 3, 2, 2⎬ = 1, ce corespunde strategiei


i j

A1, deci P1 alege această strategie.

Criteriul lui Wald

Dacă jocul are punct şa, statisticianul P1 alege strategia Ai


determinată de condiţia:
max ( min aij).
i j

Dacă jocul nu are punct şa, se determină strategia mixtă


x = (x1, ..., xm) pentru care:
⎧m ⎫
min ⎨∑ a ij x i ⎬ , este maximă.
j
⎩ i =1 ⎭
Exemplu
Aplicarea criteriului lui Wald jocului cercetat şi cu celelalte criterii
ne duce la concluzia că jocul nu are punct şa. Procedând ca în paragraful
2.3.c, se determină strategia mixtă a statisticianului şi se găseşte vectorul:
x = (1/3, 1/3, 0, 1/3),
Modele matematice în economie

de unde rezultă că P1 poate alege oricare dintre strategiile sale A1, A2 sau
A 4.
Observaţie: Criteriile aplicate nu au dus mereu la aceeaşi decizie dar
în majoritatea cazurilor s-a obţinut că cea mai bună strategie este A1;
statisticianul pe aceasta o va alege.
Aplicaţie
Patronul unui magazin achiziţionează un număr de frigidere de un
anumit tip pe o perioadă de 6 luni (primăvară – vară), pentru a le vinde. Din
observaţiile statistice, bazate pe cererea din ultimii doi ani, el estimează că
va vinde un număr de frigidere cuprins între: 15 şi 25 cu probabilitatea de
0,1; între 25 şi 35 cu probabilitatea de 0,4; între 35 şi 45 cu 0,3 şi între 45 şi
55 cu 0,2.
Costul unitar de achiziţie este de 300 euro iar preţul unitar de
vânzare este 400 euro (incluzând cheltuielile de transport şi garanţia de
funcţionare pe un an). Toate frigiderele nevândute până în toamnă se
restituie furnizorului pentru 250 euro/bucata.
Să se stabilească numărul optim de frigidere pe care să le
achiziţioneze patronul pentru a obţine un câştig cât mai mare.
Rezolvare
Determinăm matricea A = (aij), i, j = 1,4 , unde aij este câştigul

obţinut de patron când aplică strategia Ai, i = 1,4 şi cererea este în starea Sj,

j = 1,4 . Obţinem astfel:


Cererea pieţei
Cantitatea S1:20 S2:30 S3:40 S4:50
achiziţionată
A1:20 2000 2000 2000 2000
A2:30 1500 3000 3000 3000
A3:40 1000 2500 4000 4000
A4:50 500 2000 3500 5000
Teoria jocurilor

unde de exemplu elementul de pe linia A3 şi coloana S2 se calculează astfel:


din cele 40 frigidere achiziţionate se vând 30.
Diferenţa dintre preţul unitar de vânzare şi cel de achiziţionare este
de 100 euro pentru un frigider, ce reprezintă câştigul patronului. Pentru cele
30 frigidere vândute va câştiga 3000 euro. Dar alte 10 frigidere nevândute
vor fi restituite furnizorului cu o pierdere unitară de 50 euro dată de
diferenţa dintre costul de achiziţie 300 şi cel de restituire 250. Deci
pierderea va fi de 500 euro şi atunci beneficiul total va fi de: 3000 – 500 =
= 2500 euro.
Deoarece în stabilirea deciziei contează consecinţele economice se
pot aplica în rezolvarea problemei criteriile: maximin, minimax, Savage,
Bayes-Laplace:
a) Prin criteriul maximin se alege minimul fiecărei linii şi dintre
acestea se găseşte maximul:
A1 A2 A3 A4
2000 1500 1000 500

care este 2000 şi recomandă strategia A1.


b) Criteriul minimax, bazat pe prudenţă, indică alegerea elementelor
maxime pe fiecare linie şi apoi determinarea celui mai mic dintre acestea.
A1 A2 A3 A4
2000 3000 4000 5000

Acest element este 2000 şi arată că cea mai prudentă decizie este A1.
c) Criteriul lui Savage este de fapt criteriul minimax aplicat pe
matricea regretelor, ce va avea forma:
⎛ 0 500 2000 3000 ⎞
⎜ ⎟
⎜ 500 0 1000 2000 ⎟
R= ⎜
1000 500 0 1000 ⎟
⎜ ⎟
⎜1500 1000 500 0 ⎟⎠

Modele matematice în economie

pentru care vom căuta maximul pe fiecare linie şi apoi cel mai mic dintre
acestea. Găsim:
A1 A2 A3 A4
3000 2000 1000 1500

cel mai mic element este 1000 şi recomandă strategia A3.


d) Criteriul Bayes-Laplace presupune calculul câştigului mediu
pentru fiecare strategie folosind probabilităţile date în enunţul problemei şi
formulele din paragraful 2.2. Astfel:
ϕ(1,y) = 0,1⋅2000 + 0,4⋅2000 + 0,3⋅2000 + 0,2⋅2000 = 2000
ϕ(2,y) = 0,1⋅1500 + 0,4⋅3000 + 0,3⋅3000 + 0,2⋅3000 = 2850
ϕ(3,y) = 0,1⋅1000 + 0,4⋅2500 + 0,3⋅4000 + 0,2⋅4000 = 3100
ϕ(4,y) = 0,1⋅500 + 0,4⋅2000 + 0,3⋅3500 + 0,2⋅5000 = 2900
Cel mai mare câştig se obţine când se aplică strategia A3.

4. Jocuri de două persoane cu sumă arbitrară (bimatriceale)

Jocurile de două persoane cu sumă oarecare extind în mod natural


jocurile cu sumă nulă de care ne-am ocupat până acum. Ele produc şi o
schimbare calitativă importantă, în sensul că, dacă regulile jocului o permit,
jucătorii pot căuta împreună căi (strategii) de îmbunătăţire a câştigurilor lor,
ceea ce, în cazul jocurilor antagoniste, era exclus din punct de vedere logic.
Obiectul teoriei jocurilor fiind dat de analiza situaţiilor de tip
competiţional, regulile care reglementează concurenţa vor sta la baza
dezvoltărilor ulterioare.
Teoria jocurilor

Astfel, vom studia separat jocurile cu sumă arbitrară de tip


necooperativ, în care nu este permisă (sau nu există interes pentru)
colaborarea între jucători şi apoi jocurile de tip cooperativ, în care jucătorii
îşi pot corela strategiile şi/sau pot apela la transferul mutual al unor părţi din
câştiguri. Şi într-un caz şi în celălalt, preocuparea principală va fi de a defini
un concept de soluţie a jocului, de a cerceta condiţii de existenţă şi a
identifica metode de determinare a acesteia.
Ca o trăsătură care distinge jocurile cu sumă arbitrară de cele cu
sumă nulă se evidenţiază interdependenţa strategiilor componente ale unei
soluţii a jocului.

4.1 Jocuri cu sumă arbitrară necooperative

Vom nota, ca şi mai înainte, cei doi jucători cu P1 şi P2 şi vom


presupune că strategiile lor (pure) sunt în număr finit:
A = ⎨A1, ..., Am⎬ reprezintă mulţimea strategiilor lui P1, iar
B = ⎨B1, ..., Bn⎬, mulţimea strategiilor lui P2.

Definiţie: Se numeşte joc de două persoane cu sumă arbitrară dat în


formă normală, un sistem G = ⎨A, B; f1, f2⎬, unde A şi B conţin strategiile

celor doi jucători iar fi(⋅,⋅), i = 1,2 sunt funcţii definite pe A × B cu valori

reale, numite funcţii de câştig, corespunzătoare fiecăruia dintre aceştia.


Pentru o pereche de strategii (Ai, Bj) vom nota f1(Ai, Bj) = aij şi

f2(Ai, Bj) = bij, i = 1, m , j = 1, n . În vederea unei scrieri compacte a


Modele matematice în economie

elementelor care definesc un joc de acest tip, apelăm la o reprezentare


matriceală ca cea de mai jos:
P2
B1 ... Bj ... Bn
P1
A1 .
∶ .
Ai (aij, bij)
.
∶ .
Am

Deoarece elementele tabloului de mai sus sunt perechi de numere


reale care ar putea proveni din suprapunerea a două matrici de dimensiuni
m × n conţinând câştigurile celor doi jucători, luaţi separat, asemenea jocuri
se mai numesc pe scurt jocuri bimatriceale.
Să remarcăm faptul că asupra valorilor sumelor f1(Ai, Bj) + f2(Ai,Bj),
i = 1, m , j = 1, n nu se impune nici o condiţie.
Considerăm, spre exemplificare, următorul joc:
G = ⎨A, B; f1, f2⎬; A = ⎨A1, A2⎬, B = ⎨B1, B2⎬; f1(A1, B1) = 3,
f1(A2, B1) = 1, f1(A1, B2) = 1, f1(A2, B2) = 0; f2(A1, B1) = 0, f2(A2, B1) = 4,
f2(A1, B2) = 2, f2(A2, B2) = 1.
Vom analiza jocul folosind forma sa matriceală.
B1 B2
A1 (3,0) (1,2)
A2 (1,4) (0,1)

Se observă că pentru jucătorul P1 este preferabil să joace strategia A1


în raport cu A2, indiferent ce strategie adoptă P2 (B1 sau B2), deoarece avem
f1(A1, ⋅) ≥ f1(A2, ⋅) (într-adevăr, 3 > 1 şi 1 > 0).
Recunoaştem aici existenţa unei strategii dominate a jucătorului 1, în
speţă A2.
Teoria jocurilor

Referitor la strategiile lui P2, să observăm că nici una dintre ele nu o


domină pe cealaltă (0 < 2, dar 4 > 1).
Obiectivul nostru fiind acela de a prevedea desfăşurarea jocului, prin
precizarea strategiilor pe care jucătorii, cel mai probabil, le vor folosi (în
scopul raţional al maximizării câştigului), vom reduce matricea jocului
renunţând la linia corespunzătoare strategiei dominate (pe care ar fi iraţional
să o adopte P1).
B1 B2
A1 (3,0) (1,2)

Este evident acum că jucătorul P2 va alege strategia B2, care îi


asigură un câştig mai mare. În concluzie, perechea de strategii (A1, B2) se
constituie într-o soluţie a jocului, rezultată din confruntarea intereselor lui P1
şi P2. Un efect, în acest caz, este acela că nici un jucător nu îşi realizează
câştigul maxim admisibil (3, respectiv 4), fapt posibil din punct de vedere
teoretic, în general.
În exemplul precedent, raţionamentul utilizat a urmărit identificarea
unei convenţii la care jucătorii, în mod independent, sunt dispuşi să adere,
concretizate printr-o soluţie unică a jocului necooperativ. Aceasta conduce
la ideea folosirii perechii de strategii (A1, B2) în mod liber, în mai multe
partide (repetări ale jocului), de către jucători raţionali care aşteaptă unul de
la celălalt un astfel de comportament.
Ideea cristalizării unei convenţii are, desigur, o latură ideală. Nu
putem presupune că pentru un joc oarecare vom elimina pe rând, strategiile
(strict) dominate, rămânând, în final, cu o singură pereche de strategii. Pe de
altă parte, acest proces de eliminare poate să conducă la o mulţime terminală
de perechi de strategii, dintre care unele nu au calităţile unei soluţii.
Modele matematice în economie

În precizarea calităţilor pe care trebuie să le aibă o soluţie a jocului,


vom ţine cont de faptul că tendinţa unilaterală de câştig a unui jucător poate
fi amendată de opţiunile celuilalt, dar nu şi anihilată. De aceea, apare
naturală cerinţa ca strategia unui jucător, care este o componentă a soluţiei,
să reprezinte cel mai bun răspuns la strategia aleasă de celălat jucător, care
completează soluţia. O astfel de soluţie poate fi numită strategic – stabilă,
deoarece nici un jucător nu are interesul să se abată de la strategia sa, atâta
vreme cât nici ceilalţi nu încearcă acest lucru. Ideea de echilibru pe care
trebuie să îl realizeze strategiile care alcătuiesc soluţia jocului este acum
transparentă. Cele de mai înainte sunt redate în următoarea:
Definiţie. Într-un joc bimatriceal dat în formă normală
G = ⎨A, B; f1, f2⎬, perechea de strategii (A*, B*) reprezintă un punct
de echilibru Nash dacă au loc relaţiile:
f1(A*, B*) ≥ f1(Ai, B*), oricare ar fi Ai ∈ A şi
f2(A*, B*) ≥ f2(A*, Bj), oricare ar fi Bj ∈ B
Altfel spus, maxf1(Ai, B*) este atins în A*, iar maxf2(A*, Bj) e atins
Ai∈A Bj∈B
în B*.
Cum A* ∈ A şi B* ∈ B, se obişnuieşte, pentru mai multă claritate, să
se spună că (A*, B*) este punct de echilibru Nash în strategii pure.
Observaţie: Noţiunea de punct de echilibru Nash o generalizează pe
cea de punct şa de la jocurile matriceale (cu sumă nulă). Într-adevăr,
condiţiile:
f(Ai, Bjo) ≤ f(Aio, Bjo) ≤ f(Aio, Bj) (∀) Ai ∈ A, (∀) Bj ∈ B,
care definesc punctul şa aiojo = f(Aio, Bjo) se mai pot scrie:
f(Aio, Bjo) ≥ f(Ai, Bjo), (∀)Ai ∈ A,
-f(Aio, Bjo) ≥ -f(Aio, Bj), (∀)Bj ∈ B.
Teoria jocurilor

De aceea, unii folosesc termenul de punct de echilibru în loc de


punct şa atunci când se referă la soluţia unui joc matriceal G = (A, B, f).
Definiţia precedentă se poate extinde, fără dificultate, la cazul a n
jucători, ale căror funcţii de câştig sunt funcţii reale de n argumente.
Exemplu
Se consideră jocul în formă normală G, căruia îi corespunde
matricea:
B1 B2 B3 B4
A1 (4,0) (2,1) (0,4) (1,1)
A2 (0,1) (2,0) (3,3) (5,2)
A3 (2,4) (1,3) (1,2) (0,2)

Determinarea punctelor de echilibru Nash ale jocului se va face în


modul următor: pentru fiecare jucător şi pentru fiecare strategie a acestuia,
se determină răspunsul optim al celuilalt jucător la respectiva strategie.
Pentru a-l marca, vom sublinia în acea linie / coloană câştigul maxim
corespunzător.
Astfel, observăm că dacă P1 ar folosi strategia A1, atunci P2 ar trebui
să folosească strategia B3 şi vom scrie atunci (0,4) în poziţia din matrice
corespunzătoare perechii (A1, B3). Asemănător, pentru strategiile A2 şi A3
ale lui P1, vom selecta răspunsurile B3, respectiv B1 şi vom completa (3, 3),
respectiv (2, 4) în locurile potrivite din tabel.
În privinţa replicilor lui P1 la alegerile posibile ale lui P2, strategiei
B1 îi va corespunde A1 şi vom scrie în prima coloană (4, 0) (deoarece 4 > 0
şi 4 > 2). Pentru coloanele a doua, a treia şi a patra, vom selecta strategiile
de răspuns A1, A2 şi A2, respectiv.
Modele matematice în economie

Se obţine aşadar, după procedura de marcare, următorul tabel:


B1 B2 B3 B4
A1 (4,0) (2,1) (0,4) (1,1)
A2 (0,1) (2,0) (3,3) (5,2)
A3 (2,4) (1,3) (1,2) (0,2)

Ţinând seama de definiţia dată anterior, deducem că punctele de


echilibru corespund acelor perechi de câştiguri în care ambele componente
apar subliniate (dacă există). În exemplul analizat, această situaţie apare
doar în cazul perechii de strategii (A2, B3), care va reprezenta deci soluţia
Nash a jocului.
Vom clarifica în continuare legătura care există între eliminarea
strategiilor strict dominate şi existenţa punctelor de echilibru Nash. Au loc
următoarele rezultate:
Propoziţia 4.1
În jocul dat sub formă normală G = ⎨A, B; f1, f2⎬, dacă strategiile
(S 1* , S *2 ) reprezintă un punct de echilibru, atunci ele nu sunt afectate de
procedeul de eliminare a strategiilor strict dominate.
Propoziţia 4.2
Dat fiind jocul G = ⎨A, B; f1, f2⎬, dacă eliminarea succesivă a
strategiilor dominate strict conduce la desfiinţarea tuturor combinaţiilor de
strategii, cu excepţia lui (S 1* , S *2 ), atunci această pereche constituie unicul
punct de echilibru Nash al jocului.
Vom justifica cele afirmate în propoziţia 4.1, folosind reducerea la
absurd. Să presupunem că (S 1* , S *2 ) este un punct de echilibru al jocului, dar

că una dintre strategiile componente, de exemplu S 1* , a fost eliminată la un

moment dat (eventual precedată de alte strategii din A\⎨S 1* ⎬, sau B\⎨S *2 ⎬,
Teoria jocurilor

eliminate şi ele), fiind strict dominată. Să notăm cu S’1 o strategie din A care
a „supravieţuit” eliminării succesive până la momentul dispariţiei lui S 1* şi
care o domină strict pe aceasta. Are loc deci relaţia:
f1(S 1* , B) < f1(S’1, B) pentru orice strategie B dintre cele rămase la

acest moment. Cum S 1* ar fi prima eliminată dintre strategiile de echilibru,


din inegalitatea de mai sus rezultă:
f1(S 1* , S *2 ) < f1(S’1, S *2 ).

Dar astfel este contrazis faptul că S 1* este cel mai bun răspuns al lui

P1 la strategia S *2 a lui P2, aşa cum impune faptul că (S 1* , S *2 ) e punct de


echilibru. Cu aceasta, demonstraţia se încheie.
Mai departe ne preocupă problema existenţei punctelor de echilibru
multiple ale unui joc bimatriceal. Conform propoziţiei 4.1, nu este posibil ca
strategiile componente ale unuia dintre ele să fie evitate în procesul de
eliminare succesivă a strategiilor strict dominate, iar altele, cu aceeaşi
proprietate, nu. De aici rezultă că în propoziţia 4.2 este suficient să arătăm
că (S 1* , S *2 ) este punct de echilibru Nash. (Demonstraţia, asemănătoare cu
cea precedentă, se sprijină pe ipoteza că mulţimile de strategii ale ambilor
jucători sunt finite).
Ne vom servi în discuţia noastră de exemplul jocului
G = (A, B; f1, f2) cu matricea câştigurilor:
B1 B2 B3
A1 (2,0) (2,1) (4,2)
A2 (3,4) (1,2) (2,3)
A3 (1,3) (0,2) (3,0)
Modele matematice în economie

Se poate observa uşor că strategia A1 domină strict pe A3 şi că B3


domină strict pe B2 după eliminarea lui A3. După ce suprimăm strategiile
dominate, jocul are forma simplificată:
B1 B3
A1 (2,0) (4,2)
A2 (3,4) (2,3)

Urmând procedura descrisă anterior, sau prin verificare directă,


folosind definiţia, se deduce că (A1, B3) şi (A2, B1) sunt puncte de echilibru
Nash ale jocului.
Aceasta ne permite să remarcăm faptul că, spre deosebire de jocurile
cu sumă nulă, în jocurile bimatriceale, prin interschimbarea strategiilor
corespondente între două puncte de echilibru, perechile rezultate nu mai
sunt puncte de echilibru, aşa cum o demonstrează (A1, B1) şi (A2, B3).
Problema principală însă este ce anume trebuie înţeles prin soluţia
unui astfel de joc. Examinând câştigurile fiecărui jucător în parte, constatăm
că nu putem privilegia vreunul din punctele de echilibru, deoarece jucătorul
P1 preferă, firesc, pe (A1, B3), iar P2 preferă pe (A2, B1).
Teoretic, putem conveni că soluţia jocului este formată din ambele
puncte de echilibru. Practic însă este nevoie de o negociere (uneori dură)
între cei doi jucători sau de un arbitraj pentru a stabili pentru ce strategii vor
opta fiecare. Şanse mai mari de concretizare ar putea avea în acest caz
varianta care dă câştigurile (3, 4), dar elemente de ordin subiectiv nu trebuie
ignorate.
O situaţie de incertitudine în alegerea strategiilor optime ca cea de
faţă, este un teren propice pentru a testa utilitatea strategiilor de tip
maximin.
Teoria jocurilor

Astfel, în ce priveşte strategia maximin a lui P1 vom găsi:


min⎨2,2,4⎬ = 2 → A1; min⎨3,1,2⎬ = 1 → A2; min⎨1,0,3⎬ = 0 → A3,
deci strategia căutată este A1. Analog, pentru P2 avem:
min⎨0,4,3⎬ = 0 → B1; min⎨1,2,2⎬ = 1 → B2; min⎨2,3,0⎬ = 0 → B3,
de unde rezultă că strategia maximin a lui P2 este B2.
După cum se observă, însă, perechea de strategii maximin (A1, B2)
nu este un punct de echilibru. Oricare dintre jucători preferă câştigul care îi
revine ca urmare a alegerii în comun a unuia din punctele de echilibru faţă
de câştigul minim asigurat (într-adevăr (4, 2) > (2,1) şi (3, 4) > (2, 1)). În
fapt, are loc următorul rezultat general:
Propoziţia 4.3
Orice punct de echilibru furnizează fiecărui jucător în parte, un
câştig cel puţin egal cu câştigul său maximin.
Demonstraţie:
Presupunem că (A*, B*) este punct de echilibru al jocului, în
notaţiile de mai înainte. Atunci avem, pentru P1:
f1(A*, B*) ≥ f1(Ai, B*) ≥ minf
B ∈B
1(Ai, Bj) pentru orice strategie Ai ∈ A.
j

De aici rezultă imediat:


maxminf
A ∈A B ∈B
1(Ai, Bj) ≤ f1(A*, B*).
i j

Pentru jucătorul P2, obţinem folosind din nou definiţia punctului de


echilibru: f2(A*,B*) ≥ f2(A*, Bj) ≥ minf
A ∈A 2
i
(Ai, Bj), (∀) Bj ∈ B, deci
f2(A*,B*) ≥ maxminf
B ∈B A ∈A
2(Ai, Bj).
j i

În concluzie, într-un joc cu sumă arbitrară, strategiile maximin îşi


pierd din importanţă.
Modele matematice în economie

Puncte de echilibru în strategii mixte

Posibilitatea existenţei mai multor puncte de echilibru Nash într-un


joc bimatriceal, cu implicaţiile sale în stabilirea soluţiei jocului nu este,
totuşi, lucrul care stânjeneşte cel mai mult. O problemă fundamentală care
apare în acest context este faptul că există jocuri cu sumă arbitrară chiar
dintre cele mai simple, care nu admit strategii pure de echilibru.
Să considerăm următorul joc:
B1 B2
A1 (2,1) (0,2)
A2 (1,2) (3,0)

Se poate observa pe acest exemplu că nici o pereche de strategii


(Ai, Bj) nu poate realiza echilibrul. Astfel, pentru (A1, B1) observăm că
jucătorul P2 are interesul să devieze de la strategia B1 către B2, care îi
asigură un câştig superior. Analog, (A2, B1) nu poate fi punct de echilibru,
pentru că jucătorul P1 va prefera strategia A1 lui A2, ş.a.m.d..
Este greu de admis ideea că astfel de jocuri nu admit soluţie, în
sensul echilibrului de tip Nash. Cheia de rezolvare stă şi aici, ca şi în cazul
jocurilor cu sumă nulă, în lărgirea conceptului de strategie şi definirea
noţiunii de echilibru în această accepţiune mai largă.
Trebuie făcută precizarea că noul tip de strategie îl înglobează pe cel
utilizat până acum în discuţie şi că identificarea unor puncte de echilibru
corespunzătoare lui nu suprimă posibilitatea existenţei, pentru un acelaşi
joc, a punctelor de echilibru în strategii pure.
Obişnuim să numim strategie mixtă pe mulţimea A = ⎨A1, ..., Am⎬ a
strategiilor (pure) ale jucătorului P1 o repartiţie de probabilităţi:
m
x = (x1, ..., xm), unde xi ≥ 0, i = 1, m şi ∑x
i =1
i = 1.
Teoria jocurilor

Mulţimea tuturor acestor strategii o notăm prin X. Analog vom


considera:
n
Y = ⎨y = (y1,..., yn) ⏐ yj ≥ 0, ∑ y = 1⎬
j =1
j ca fiind ansamblul

strategiilor mixte pe mulţimea B, a strategiilor jucătorului P2.


Ideea de strategie mixtă se leagă, în mod natural, de alternarea
strategiilor de către un jucător, în decursul mai multor partide. Cum
probabilităţile pot fi interpretate ca limite ale unor frecvenţe relative, se
pune întrebarea dacă în situaţii reale putem considera ca acceptabilă
repetarea (independentă) a jocului de un număr de ori suficient de mare.
Se poate încerca evitarea acestei dificultăţi prin interpretarea unei
strategii mixte a lui P2, y = (y1, ..., yn) ca reprezentând probabilităţile
(subiective) pe care le atribuie P1 utilizării uneia dintre strategiile pure
B1, ..., Bn de către P2 şi, asemănător, a unei strategii mixte a lui P1
(x1, ..., xm), schimbând rolurile între jucători. Impasul ce se profilează aici
ţine de tratarea jocurilor cu mai mult de doi jucători, caz în care doi jucători
pot avea percepţii diferite relative la comportarea unui terţ.
Oricare ar fi interpretarea dată strategiilor mixte, ele ne ajută să
punem în termeni corecţi problema maximizării unui câştig incert, prin
apelul la conceptul fundamental de medie a unei variabile aleatoare.
În condiţiile alegerii independente şi simultane a strategiilor de către
fiecare jucător în parte, folosindu-ne de notaţiile de mai înainte, vom defini
câştigurile celor doi, în ipoteza folosirii strategiilor mixte x şi y, respectiv,
m n
prin: ϕ1(x, y) = ∑∑ a x y
i =1 j =1
ij i j ;

m n
ϕ2(x, y) = ∑∑ b x y
i =1 j=1
ij i j ; ϕi: X × Y → ℝ, i = 1,2 ,
Modele matematice în economie

unde xi ⋅ yj reprezintă probabilitatea utilizării perechii de strategii (Ai, Bj),


iar aij şi bij sunt câştigurile asociate ei ale jucătorilor P1 şi P2, respectiv.
Să observăm că de exemplu, câştigul mediu ϕ1(x, y) este o medie a
unor câştiguri medii, considerând, pe rând, strategiile din A fixate faţă de
cele din B, după cum o arată relaţia:
m ⎛ n ⎞
ϕ1(x, y) = ∑ ⎜⎜ ∑ a ij y j ⎟⎟ xi.
i =1 ⎝ j=1 ⎠
Cu aceste precizări, putem să dăm definiţia extinsă a punctelor de
echilibru ale unui joc bimatriceal în formă normală:
Definiţie: Într-un joc bimatriceal G = ⎨A, B; f1, f2⎬, o pereche de
strategii mixte (x*, y*) este un punct de echilibru Nash dacă au loc
următoarele inegalităţi:
ϕ1(x*,y*) ≥ ϕ1(x, y*)
ϕ2(x*,y*) ≥ ϕ2(x*, y)
pentru orice strategii mixte x ∈ X şi y ∈ Y.
Cu alte cuvinte, x* este cea mai bună strategie (mixtă) de răspuns a
lui P1 la strategia y* a lui P2 şi viceversa.
Se deduce din cele de mai sus că putem porni la determinarea
strategiilor mixte de echilibru ale unui joc (a căror existenţă o vom afirma
ceva mai târziu) prin găsirea celui mai bun răspuns (în strategii mixte sau
pure) al unui jucător la o strategie mixtă a celuilalt.
În demersul nostru ne servim de următorul rezultat:
Propoziţia 4.4
Pentru ca o strategie mixtă a lui P1 să fie un cel mai bun răspuns al
acestuia la o strategie mixtă dată y a lui P2, este necesar şi suficient ca ea să
asigneze probabilităţi strict pozitive numai acelor strategii pure care sunt ele
Teoria jocurilor

însele un cel mai bun răspuns la strategia y (sau numai unei părţi a acestora,
restul primind probabilităţi nule).
Demonstraţie:
Să notăm, pentru o strategie y dată, cu Imax mulţimea indicilor acelor
strategii pure ale lui P1 care sunt un cel mai bun răspuns la y:
n n
Imax = ⎨K ⏐ ∑ a kj y j ≥ ∑ a ij y j , (∀) i = 1, m ⎬.
j=1 j=1

Să alegem un K0 ∈ Imax. Fie x = (x1, ..., xm) o strategie mixtă a lui P1


şi să presupunem că există l ∈ 1, n \ Imax astfel încât xl > 0. Notăm cu x’

strategia mixtă obţinută din x prin asocierea probabilităţii x K 0 + xl la

strategia A K 0 şi a unei probabilităţi nule la Al. Atunci vom avea:

⎛ n ⎞ n n
ϕ1(x, y) = ∑ i⎜∑ x ⎜ a y ⎟
ij j ⎟ + x K0 ∑ K0 j j
a y + x l ∑ a lj y j <
i ≠ K 0 ,l ⎝ j=1 ⎠ j =1 j=1

⎛ n ⎞ n n
< ∑ ⎜ ∑ ij j ⎟ K 0 l ∑

i ≠ K 0 , l ⎝ j =1
a y ⎟ + ( x + x ) a y
K0 j j + 0 ⋅ ∑ a lj y j = ϕ1 ( x ' , y) , de
⎠ j =1 j=1

unde deducem că x nu este cea mai bună strategie de răspuns la y.


Pentru probarea suficienţei, se consideră I0 ⊆ Imax şi o strategie mixtă

( )
x0 = x i0
m
i =1
care asignează probabilităţi nenule numai acelor strategii Ah, cu

h ∈ I0. De aici rezultă:


⎛ n ⎞ ⎛ ⎞ n n
ϕ1 ( x 0 , y) = ∑ x ⎜⎜ ∑ a
0
h hj y j ⎟⎟ = ⎜⎜ ∑ x 0h ⎟⎟ max ∑ a ij y j = max ∑ a ij y j , şi
h∈I 0 ⎝ j =1 ⎠ ⎝ h∈I 0 ⎠ i =1, m j=1 i =1, m
j =1

mai departe:
m ⎛ n ⎞ m n
ϕ1(x, y) = ∑ x i ⎜ ∑ ij j ⎟
⎜ a y ⎟ ≤ ∑ x i max
i =1, m
∑ a ij y j = ϕ1(x0, y), oricare ar
i =1 ⎝ j=1 ⎠ i =1 j =1

fi strategia mixtă x ∈X. Deci x0 este răspuns optim al lui P1 la strategia y.


Modele matematice în economie

Un enunţ similar celui din propoziţia 4.4 caracterizează strategiile


mixte ale lui P2 care sunt răspunsuri optime la o strategie mixtă x a lui P1,
fixată.
Reamintim că orice strategie pură a unui jucător poate fi interpretată
ca o strategie mixtă, exprimabilă printr-un vector binar cu 1 pe poziţia
corespunzătoare strategiei şi având restul componentelor egale cu 0.
Revenind la exemplul de mai înainte al jocului bimatriceal 2 × 2, să
încercăm determinarea unui punct de echilibru în strategii mixte. Pentru
simplitate, vom nota strategiile mixte ale lui P1 prin x = (p, 1 – p) şi
strategiile mixte ale lui P2 cu y = (q, 1 – q), p, q ∈ [0, 1].
Într-o primă etapă, vom găsi strategiile pure optime de răspuns ale
fiecărui jucător, la o strategie mixtă a adversarului.
Pentru o strategie mixtă dată (q, 1 – q) pe B = ⎨B1, B2⎬, câştigul
mediu al lui P1 va fi 2q + 0(1 – q) = 2q, dacă foloseşte strategia A1 sau
1 ⋅ q + 3(1 – q) = 3 – 2q, dacă foloseşte strategia A2.
Rezolvând inecuaţia 2q > 3 – 2q pe intervalul [0, 1], deducem:
3
- dacă q ∈ [0, ), cel mai bun răspuns al lui P1 este A2;
4
3
- dacă q = , atunci A1 şi A2 sunt răspunsuri la fel de bune;
4
3
- dacă q ∈ ( , 1], cel mai bun răspuns al lui P1 este A1.
4
Inversând rolurile, fie (p, 1 – p) o strategie mixtă pe A = ⎨A1, A2⎬.
Câştigul mediu al lui P2 va fi 1 ⋅ p + 2(1 – p) = 2 – p, dacă foloseşte strategia
B1 sau 2p, dacă utilizează strategia B2. Folosindu-ne de soluţia inecuaţiei
2 – p > 2p pe [0, 1], constatăm următoarele:
2
- pentru p ∈ [0, ), răspunsul optim al lui P2 este B1;
3
Teoria jocurilor

2
- pentru p = , P2 poate răspunde atât cu B1, cât şi cu B2;
3
2
- pentru p ∈ ( , 1], răspunsul optim al lui P2 este B2.
3
Căutăm acum o pereche de strategii mixte (x*, y*), x* = (p*, 1-p*),
y* = (q*, 1 – q*) cu proprietăţile din definiţia extinsă a echilibrului Nash.
Vom analiza pe rând diversele situaţii posibile.
3
I. Dacă q* ar aparţine intervalului [0, ), atunci răspunsul optim
4
al lui P1 ar fi strategia pură A2, căreia îi corespunde p = 0 ca
strategie mixtă. Însă răspunsul optim al jucătorului P2 la această
3
strategie este B1, corespunzând lui q = 1. Cum 1 ∉ (0, ], acest
4
caz nu e compatibil cu existenţa unui punct de echilibru.
3
II. Dacă q* ∈ ( , 1], cel mai bun răspuns al lui P1 este A1, pe care
4
îl identificăm cu strategia mixtă (1, 0). Cel mai bun răspuns al
lui P2 la această strategie este strategia pură B2, pentru care
3
avem q = 0. Dar 0 ∉ ( , 1] şi concluzia e identică celei de la
4
punctul precedent.
3
III. În cazul q* = , ca răspuns optim al jucătorului P1 putem lua
4
orice strategie mixtă (r, 1 – r) pe ⎨A1, A2⎬, r ∈ [0, 1], conform
2 2
cu propoziţia 4.4. Dar situaţiile r ∈ [0, ) şi r ∈ ( , 1] conduc
3 3
la valori ale răspunsurilor corespunzătoare lui q = 1 şi q = 0,
3 2
respectiv, ambele diferite de . Pentru r = , răspunsul optim
4 3
Modele matematice în economie

fiind orice strategie mixtă (q, 1 – q) pe ⎨B1, B2⎬, în particular


3 1 2
( , ), rezultă că putem alege p* = . În concluzie, punctul de
4 4 3
echilibru al jocului, în strategii mixte, este:
2 1 3 1
(x*,y*) = (( , ), ( , )).
3 3 4 4
Importanţa considerării strategiilor mixte în identificarea soluţiilor
posibile ale unui joc bimatriceal reiese din următorul rezultat (pe care îl dăm
într-un caz particular):
Teorema lui Nash
Orice joc finit de două persoane în formă normală, G = ⎨A, B; f1, f2⎬
posedă cel puţin un punct de echilibru, în strategii pure sau mixte.
Demonstraţia teoremei, al cărei enunţ în formă generală se referă la
jocuri de n persoane, are la bază o teoremă de punct fix.
(În cazul de faţă, (x*,y*) cu proprietatea T(x*, y*) = (x*,y*) este
punct fix al unei transformări T). Deşi în demonstraţie nu se construieşte
efectiv un punct de echilibru, concluzia sa este suficient de elocventă.
Vom prezenta în cele ce urmează o procedură de determinare a
punctelor de echilibru ale unui joc bimatriceal în formă normală, atunci când
jucătorii P1, P2 au la dispoziţie m şi n strategii pure, respectiv, cu ajutorul
unui exemplu concret. Vom avea în vedere cazul când câştigurile jucătorilor
sunt nenegative, dar aceasta, după cum se constată, nu reprezintă o restricţie
importantă.
Sunt necesare câteva precizări şi notaţii. Astfel, vom nota cu C1
matricea câştigurilor jucătorului P1 definită prin:
C1 = (aij) i =1, m , aij = f1(Ai, Bj), Ai ∈A, Bj ∈ B.
j=1, n
Teoria jocurilor

Asemănător, C2 va desemna matricea câştigurilor jucătorului P2:


C2 = (bij) i =1, m
, bij = f2(Ai, Bj), Ai ∈ A, Bj ∈ B.
j=1, n

Pentru două strategii mixte, x = (x1, ..., xm) a lui P1 şi y = (y1,..., yn) a
lui P2, se pot transcrie câştigurile medii ale fiecărui jucător în parte, astfel:
ϕ1(x, y) = xC1yT, ϕ2(x, y) = yC T2 xT, unde indicii T înseamnă operaţia
de transpunere.
Notând Jm şi Jn vectorii-linie cu m, respectiv n componente, toate
egale cu 1, vom putea scrie relaţiile:
xJ Tm = 1, y J Tn = 1 (1)
sinonime cu faptul că suma probabilităţilor (xi)i∈1, m (respectiv (yj)j∈1, n ) face
1.
Să presupunem acum că (x, y) reprezintă o pereche de strategii de
echilibru şi să notăm, pentru simplitate, cu ϕ1 şi ϕ2 câştigurile aferente ei ale
celor doi jucători.

Introducem vectorii Φ1 = (ϕ1, ..., ϕ1) ∈ℝn şi Φ2 = (ϕ2, ..., ϕ2) ∈ℝn,
care ne permit o scriere matriceală a proprietăţii de echilibru. Astfel,
folosind propoziţia 4.4, deducem relaţiile:
C1yT ≤ Φ 1T , C T2 xT ≤ Φ T2 (2)
în care inegalităţile trebuie interpretate ca funcţionând între oricare două
componente corespondente ale vectorilor – coloană. Ele exprimă faptul că
răspunsurile printr-o strategie pură la strategiile y, respectiv x pot să ducă, în
cel mai bun caz, la egalarea câştigurilor ϕ1, respectiv ϕ2. Acestea sunt atinse
efectiv în (x, y), ceea ce reiese din relaţiile:
xC1yT = xΦ 1T ⇔ x(Φ 1T - C1yT) = 0

yC T2 xT = yΦ T2 ⇔ y(Φ T2 - C T2 xT) = 0 (3)


Modele matematice în economie

în care am ţinut seama de (1).


Rezultă din cele de mai înainte că un punct de echilibru Nash, (x, y),
al unui joc bimatriceal trebuie să satisfacă cele şase relaţii date, la care se
adaugă condiţiile x ≥ 0 şi y ≥ 0.
Concret, vom găsi soluţiile următorului joc bimatriceal, folosind
instrumentarul prezentat pentru cazul general.

B1 B2 B3
A1 (4,0) (2,1) (8,6)
A2 (6,12) (2,10) (4,9)

Cele două matrici de câştiguri ale jucătorilor sunt:


⎛ 4 2 8⎞ ⎛ 0 1 6⎞
C1 = ⎜⎜ ⎟⎟ şi C2 = ⎜⎜ ⎟⎟
⎝ 6 2 4⎠ ⎝12 10 9 ⎠
Suntem în cazul a m = 2 strategii pure ale jucătorului P1 şi a n = 3
strategii pure ale jucătorului P2.
Vom separa relaţiile de tip liniar de cele neliniare şi apoi le vom
grupa astfel încât să ne ocupăm separat de strategia (x1, x2), respectiv
(y1, y2, y3). Din relaţiile (1) şi (2) va rezulta:
x1 + x2 = 1 y1 + y 2 + y 3 = 1
12x2 - ϕ2 ≤ 0 4y1 + 2y2 + 8y3 - ϕ1 ≤ 0
x1 + 10x2 - ϕ2 ≤ 0 6y1 + 2y2 + 4y3 - ϕ1 ≤ 0
6x1 + 9x2 - ϕ2 ≤ 0
x1, x2 ≥ 0 y1, y2, y3 ≥ 0
Pentru jocul analizat, atât ϕ1 cât şi ϕ2 sunt nenegative şi ca atare,
vom nota x3 = ϕ2 şi y4 = ϕ1. De asemenea, vom transforma, în sistemele
scrise anterior, inegalităţile în egalităţi, prin introducerea unor variabile-
ecart, notate θi, i = 1,2 , respectiv µj, j = 1,3 .
Teoria jocurilor

Obţinem:
x1 + x2 = 1 y1 + y 2 + y 3 = 1
(I) 12x2 – x3 + µ1 = 0 (II) 4y1 + 2y2 + 8y3 – y4 + θ1 = 0
x1 + 10x2 - x3 + µ2 = 0 6y1 + 2y2 + 4y3 - y4 + θ2 = 0
6x1 + 9x2 - x3 + µ3 = 0
x1, ..., x3 ≥ 0; µ1,...,µ3 ≥ 0 y1, ..., y4 ≥ 0; θ1, θ2 ≥ 0

Relaţiile (3) vor avea drept corespondent următoarele egalităţi:


(III) x1θ1 + x2θ2 = 0
y1µ1 + y2µ2 + y3µ3 = 0

Căutarea soluţiilor jocului bimatriceal se structurează aşadar în:


- rezolvarea în domeniul numerelor nenegative a sistemului liniar (I),
în necunoscutele x1, x2, x3, µ1, µ2, µ3;
- rezolvarea în domeniul numerelor nenegative a sistemului liniar
(II), în necunoscutele y1, y2, y3, y4, θ1, θ2;
- „filtrarea” soluţiilor, prin verificarea, de tip încrucişat, a
îndeplinirii condiţiilor (III).

În fapt, obiectivul nostru principal este să deducem soluţiile posibile


de bază pentru fiecare din sistemele (I) sau (II), deoarece soluţia generală se
poate obţine ca o combinaţie liniară convexă a soluţiilor de bază. Probarea
condiţiilor (III) o vom face aşadar pentru diferite perechi de soluţii de bază.
Modele matematice în economie

Să considerăm matricea sistemului liniar (I), în care fiecare coloană


este notată cu ak, k = 1,6 :
a1 a2 a3 a4 a5 a6
⎛1 1 0 0 0 0⎞
⎜ ⎟
⎜ 0 12 − 1 1 0 0⎟
⎜ 1 10 − 1 0 1 0⎟
⎜ ⎟
⎜ 6 9 −1 0 0 1 ⎟⎠

Procedura este cea cunoscută de la programarea liniară: se aleg patru

coloane din cele 6 astfel încât ele să formeze o bază în ℝ4,


B = ⎨a k 1 , a k 2 , a k 3 , a k 4 ⎬.

Atunci soluţia de bază va fi dată de (x, µ) = (B-1b, 0), unde


b = (1, 0,0,0)T este coloana termenilor liberi şi toate variabilele ale căror
coloane asociate nu au intrat în bază iau valoarea 0.
Fie de exemplu mulţimea ⎨a1, a2, a3, a5⎬. Deoarece:

1 1 0 0
0 12 − 1 0
det[a1, a2, a3, a5] = = 9 ≠ 0, rezultă că
1 10 − 1 1
6 9 −1 0

B = ⎨a1, a2, a3, a5⎬ este o bază. Alegem µ1 = µ3 = 0. Avem de


rezolvat sistemul:
x1 + x2 = 1
12x2 – x3 = 0
x1 + 10x2 - x3 + µ2 = 0
6x1 + 9x2 - x3 = 0
Teoria jocurilor

Se deduce uşor că x3 = 12x2, x2 = 2x1. Cum x1 + x2 = 1, rezultă


1 2
x1 = , x2 = , x3 = 8 şi µ2 = 1.
3 3
1 2
Soluţia de bază va fi deci (x, µ)1 = ( , ,8,0,1,0), având toate
3 3
componentele pozitive sau nule.
Repetând procedeul pentru alte baze şi testând nenegativitatea
componentelor soluţiilor, vom găsi încă două soluţii posibile de bază.
(x, µ)2 = (1,0,6,6,5,0), corespunzând bazei ⎨a1, a3, a4, a5⎬ şi
(x, µ)3 = (0,1,12, 0,2,3), corespunzând bazei ⎨a2, a3, a5, a6⎬.
Matricea sistemului (II) este:
b1 b2 b3 b4 b5 b6
⎛ 1 1 1 0 0 0⎞
⎜ ⎟
⎜ 4 2 8 −1 1 0⎟
⎜ 6 2 4 −1 0 1⎟
⎝ ⎠

Putem alege o bază formată din coloanele b1, b2 şi b4, deoarece


determinantul corespunzător lor are valoarea -2. Alegem y3 = θ1 = θ2 = 0.
Din sistemul:
y1 + y2 = 1
4y1 + 2y2 – y4 = 0
6y1 + 2y2 – y4 = 0
deducem y1 = 0, y2 = 1 şi y4 = 2, care ne dau soluţia posibilă de bază:
(y, θ)1 = (0,1,0,2,0,0).
Pentru bazele ⎨b1, b3, b4⎬, ⎨b3, b4, b6⎬ şi ⎨b1, b4, b5⎬, vom obţine alte
soluţii posibile de bază ale sistemului:
2 1 16
(y, θ)2 = ( , 0, , , 0, 0), (y, θ)3 = (0,0,1,8,0,4),
3 3 3
Modele matematice în economie

(y, θ)4 = (1, 0,0,6,2,0).


Înainte de a trece la verificarea condiţiilor (III), observăm că, în
ipotezele de nenegativitate a componentelor, x1θ1 + x2θ2 = 0 este
echivalentă cu x1θ1 = 0 şi x2θ2 = 0 şi similar y1µ1 + y2µ2 + y3µ3 = 0 e
îndeplinită dacă şi numai dacă y1µ1 = 0, y2µ2 = 0 şi y3µ3 = 0.
În consecinţă, dacă un θ (µ) este nenul, atunci componenta x
(y) cu acelaşi indice trebuie să fie egală cu zero.
Pentru facilitarea examinărilor necesare, vom construi două
tabele în care marcăm în prima coloană cuplul de strategii (x, y)
examinat, prin indicii corespunzători ordinilor date, iar în ultima
coloană, prin *, dacă perechea (x, y) respectă condiţia impusă. Primul
tabel este:
(x,y) θ1 θ2 x1 x2 */-
(1,1) 0 0 1/3 2/3 *
(2,1) 0 0 1 0 *
(3,1) 0 0 0 1 *
(1,2) 0 0 1/3 2/3 *
(2,2) 0 0 1 0 *
(3,2) 0 0 0 1 *
(1,3) 0 4 1/3 2/3 -
(2,3) 0 4 1 0 *
(3,3) 0 4 0 1 -
(1,4) 2 0 1/3 2/3 -
(2,4) 2 0 1 0 -
(3,4) 2 0 0 1 *
Teoria jocurilor

Referitor la modul de completare a tabelului, am marcat cu *


perechea (2,3), deoarece θ1x1 = 0 ⋅ 1 = 0 şi θ2x2 = 4 ⋅ 0 = 0, în timp ce pentru
1
perechea (1, 4) avem θ1 = 2 ≠ 0 şi x1 = ≠ 0, ş.a.m.d..
3
Cel de-al doilea tabel se prezintă astfel:
(x,y) µ1 µ2 µ3 y1 y2 y3 */-
(1,1) 0 1 0 0 1 0 -
(1,2) 0 1 0 2/3 0 1/3 *
(1,3) 0 1 0 0 0 1 *
(1,4) 0 1 0 1 0 0 *
(2,1) 6 5 0 0 1 0 -
(2,2) 6 5 0 2/3 0 1/3 -
(2,3) 6 5 0 0 0 1 *
(2,4) 6 5 0 1 0 0 -
(3,1) 0 2 3 0 1 0 -
(3,2) 0 2 3 2/3 0 1/3 -
(3,3) 0 2 3 0 0 1 -
(3,4) 0 2 3 1 0 0 *

Am marcat cu * cuplul de strategii (1, 2), pentru că avem:


2 1
µ1y1 = 0 ⋅ = 0, µ2y2 = 1 ⋅ 0 = 0 şi µ3y3 = 0 ⋅ = 0. În schimb
3 3
cuplul (3, 2) va fi marcat cu – (respins), deoarece µ1y1 = µ2y2 = 0, însă
1
µ3y3 = 3 ⋅ = 1 ≠ 0.
3
Vom extrage din fiecare tabel perechile de strategii marcate cu
asterisc şi apoi vom intersecta cele două mulţimi. Astfel obţinem:
⎨(1,1), (2,1), (3,1), (1,2), (2,2), (3,2), (2,3), (3, 4)⎬ ∩
∩ ⎨(1,2), (1,3), (1,4), (2,3), (3, 4)⎬ = ⎨(1,2), (2,3), (3, 4)⎬.
Intersecţia găsită conţine strategiile de echilibru Nash (pure sau
mixte) ale jocului considerat. Acestea sunt (respectând ordinea):
Modele matematice în economie

⎛⎛ 1 2 ⎞ ⎛ 2 1 ⎞⎞
⎜⎜ ⎜ , ⎟, ⎜ ,0, ⎟ ⎟⎟ ; ((1, 0), (0,0,1)); ((0,1), (1, 0,0)).
⎝⎝ 3 3 ⎠ ⎝ 3 3 ⎠⎠
Se observă că avem o pereche de strategii mixte (prima) şi două
perechi de strategii pure, mai exact (A1, B3) şi (A2, B1).
În încheierea discuţiei despre punctele de echilibru ale unui joc
bimatriceal, facem următoarele observaţii:
1. În situaţia în care elementele matricelor de câştiguri nu sunt toate
pozitive sau nule, trebuie să considerăm că ϕ1 şi ϕ2 sunt numere
reale. Pentru a putea să ne folosim în continuare de procedeul
descris mai înainte, putem proceda în două moduri:
a) să exprimăm fiecare variabilă ϕi, i = 1,2 ca diferenţa a două
variabile cărora li se impune să ia valori nenegative:
ϕi = ϕ’i - ϕ”i, ϕ’i ≥ 0, ϕ”i ≥ 0, i = 1,2 ;

b) să adunăm la matricile C1 sau C2 o matrice (m × n) formată


din constante identice între ele, suficient de mari,
transformarea neafectând decât valorile câştigurilor medii, nu
şi determinarea strategiilor de echilibru;
2. În exemplul rezolvat mai înainte, trebuiau considerate cel mult
C 64 = 15 situaţii care conduc la o bază pentru matricea sistemului

(I) şi cel mult C 36 = 20 situaţii de acelaşi tip în cazul sistemului


(II). Pentru un număr mai mare de strategii ale fiecărui jucător,
pentru a fi aplicabilă, metoda face apel la un program care
generează soluţii posibile de bază şi le testează în mod automat;
3. Asupra elementelor matricilor de câştiguri pot fi operate şi alte
tipuri de transformări, ca de pildă scalarea (înmulţirea cu un factor
pozitiv). De asemenea se poate discuta despre o strategie pură
Teoria jocurilor

dominată de o strategie mixtă, care ar putea să o disloce, fără a


afecta esenţial găsirea punctelor de echilibru, (Cititorul este
îndemnat să compare ultimul joc analizat cu unul prezentat
anterior şi să tragă concluziile de rigoare).

4.2 Jocuri bimatriceale cooperative

Aşa cum arătam la începutul discuţiei privind jocurile cu sumă


arbitrară, un joc cooperativ este acela în care regulile sale permit alegerea în
comun a strategiilor şi transferul de câştiguri între jucători, în scopul
cointeresării lor într-o anumită acţiune comună.
Ne vom servi de exemplul câtorva jocuri, pentru a ilustra situaţii în
care jucătorii au interesul să coopereze între ei. Punctul de plecare îl va
constitui, în ideea continuităţii, noţiunea de cuplu de strategii de echilibru
Nash.
Să considerăm jocul bimatriceal următor:
B1 B2 B3
A1 (1,2) (2,-2) (3,1)
A2 (2,2) (4,-1) (6,3)

Se observă cu uşurinţă că perechea de strategii (A2, B3) reprezintă un


punct de echilibru al jocului (în strategii pure). În particular, câştigurile
corespunzătoare ale jucătorilor (6, respectiv 3) sunt valorile maxime ale
funcţiilor de câştig ale fiecăruia, deci şi suma câştigurilor (care nu mai poate
fi îmbunătăţită prin considerarea strategiilor mixte) este maximă, între toate
combinaţiile posibile de strategii. Într-un asemenea caz, ipoteza cooperării
între cei doi jucători nu are nici un efect.
Modele matematice în economie

Dacă însă analizăm jocul:

B1 B2
A1 (3,2) (9,1)
A2 (2,8) (7,5)

vom constata că, deşi (A1, B1) este punct de echilibru al jocului, câştigurile
care le revin jucătorilor nu îi pot mulţumi. Chiar suma lor, 5, ia valoarea cea
mai mică posibilă. Eliminând perechile (A2, B1) şi (A1, B2), care favorizează
un jucător şi îl defavorizează pe celălalt, rămâne perechea (A2, B2), ale cărui
câştiguri aduc un plus amândurora faţă de ce le oferă strategiile de echilibru.
Ea este însă instabilă.
Ieşirea din această dilemă se face prin modificarea regulilor jocului,
prin acceptarea cooperării. Odată acceptată, ea aduce cu sine însă o altă
problemă, aceea a împărţirii între cei doi jucători a câştigului comun, egal cu
12. Teoretic, se poate impune interzicerea plăţilor laterale între jucători,
situaţie în care distribuţia câştigurilor poate să rămână cea de la început. Nu
vom adopta o asemenea ipoteză în cele ce urmează.
Jocurile de tip cooperativ au o problematică specifică şi rezolvarea
lor presupune atât introducerea unor noţiuni noi cât şi revalorizarea altora
mai vechi.
Se pune astfel o primă întrebare: sub ce limită a câştigului nu poate
să accepte să coboare fiecare jucător?
Răspunsul îl furnizează acel câştig pe care îl poate obţine un jucător,
acţionând în mod independent, indiferent de strategia (pură sau mixtă)
aleasă de celălalt jucător. Referindu-ne la primul jucător, obţinem valoarea
maximin a jocului corespunzătoare lui, dată de expresia:
Teoria jocurilor

u* = max min ϕ1(x,y),


x∈X y∈Y

unde x şi y sunt strategii mixte pe mulţimea strategiilor lui P1, respectiv ale
lui P2. Analog, pentru P2 valoarea maximin va fi:
v* = max min ϕ2(x,y).
y∈Y x∈X

Deci, notând cu (u, v) o pereche de câştiguri ale celor doi jucători, ea


ar putea constitui o soluţie a jocului cooperativ numai dacă avem
(u, v) ≥ (u*, v*).
La întrebarea unde trebuie căutată soluţia jocului, răspunsul îl dă
noţiunea fundamentală de mulţime admisibilă. Aceasta, notată cu S, este
mulţimea tuturor perechilor de câştiguri (u, v) pe care le pot obţine, prin
cooperare în alegerea strategiilor, cei doi jucători. Datorită faptului că sunt
acceptate strategiile mixte şi, mai mult, ele pot fi corelate, această

submulţime a lui ℝ2 are proprietatea de convexitate. Este de presupus că


forma lui S va avea o influenţă asupra găsirii soluţiei jocului.
O altă noţiune importantă este aceea de frontieră Pareto-optimală a
mulţimii admisibile S. Astfel, un punct (u, v) ∈ S aparţine acesteia dacă
oricare ar fi ε > 0, δ > 0 rezultă (u + ε, v) ∉ S şi (u, v + δ) ∉ S.
Vom ilustra noţiunile introduse mai înainte şi vom schiţa metoda de
găsire a soluţiei, folosindu-ne de exemplul următorului joc bimatriceal.
B1 B2
A1 (1,2) (3,8)
A2 (2,0) (4,5)
A3 (3/2,6) (5,3)
Modele matematice în economie

Presupunem că regulile jocului permit cooperarea între jucători (dar


nu ca o consecinţă a faptului că jocul nu admite puncte de echilibru în
strategii pure).
Inversând ordinea de mai înainte, vom determina mai întâi mulţimea
admisibilă S, precizând frontiera sa Pareto-optimală, folosindu-ne de o
reprezentare grafică. Dacă notăm cu W11 punctul din plan de coordonate
3
(1, 2) şi, mai departe, W12 = (3, 8), W21 = (2, 0), W22 = (4, 5), W31 = ( , 6),
2
W32 = (5, 3), unde legătura dintre perechile de indici şi perechile de câştiguri
este evidentă, atunci S va fi reprezentată prin aşa-numita „acoperire
convexă” a punctelor W11, ..., W32 (adică cea mai mică mulţime convexă
plană care le conţine), dată în figura următoare prin mulţimea haşurată:
V W12

W31

W22
S
W32
W11

0 W21 u

Să precizăm că există cazuri în care unele puncte - câştiguri W pot să


fie situate în interiorul poligonului convex determinat de restul punctelor,
caz în care mulţimea S va fi generată folosind numai aceste din urmă
puncte.
Frontiera Pareto-optimală a lui S va fi formată, în mod firesc, din
laturi ale poligonului W11W21 ... W31. Singurele care satisfac condiţia dată
sunt W12W22 şi W22W32. (Pentru puncte (u, v) aparţinând altor segmente,
Teoria jocurilor

cum ar fi W21W32 sau W31W12 este suficient să luăm (u, v + δ) sau (u + ε, v),
cu ε, δ > 0 alese corespunzător, pentru a constata că punctele obţinute fac
parte din S). Această frontieră Pareto [W12, W22, W32] va constitui, de fapt,
zona de interes în identificarea soluţiei jocului, deoarece ea corespunde
cursului de creştere, atât în u cât şi în v, a punctelor (u, v) din S, favorabil
ambilor jucători.
În continuare vom găsi valorile maximin ale jocului (în strategii
mixte). Pentru a uşura calculele, să facem observaţia că atunci când dorim să
minimizăm ϕ1(x, y) în raport cu y ∈ Y, pentru un x ∈ X fixat, este suficient
să considerăm strategiile pure y = (1, 0) şi y = (0, 1) deoarece putem scrie:
ϕ1(x, y) = xC1yT = (x1, x2, x3)C 11 y1 + (x1, x2, x3) C 12 y2

unde y = (y1, y2), y1, y2 ≥ 0, y1 + y2 = 1, iar C 11 şi C 12 sunt respectiv prima şi


a doua coloană a matricei de câştiguri a jucătorului P1, notată C1. Concret,
vom avea:
3
min ϕ1(x, y) = min⎨x1 + 2x2 + x3, 3x1 + 4x2 + 5x3⎬ =
y∈Y 2
3
= x1 + 2x2 + x3 (x1, x2, x3 ≥ 0)
2
Cum X = ⎨(x1, x2, x3)⎪x1, x2, x3 ≥ 0, x1 + x2 + x3 = 1⎬ este un simplex

în ℝ3, vom găsi:


3
u* = max min ϕ1(x, y) = max (x1 + 2x2 + x3) = 2, care se atinge în
x∈X y∈Y x∈X 2
vârful (0,1,0) al lui X.
Cu un argument asemănător, folosind egalitatea ϕ2(x, y) = yC T2 xT,
unde C2 este matricea câştigurilor lui P2, vom obţine:
min ϕ2(x, y) = min⎨2y1 + 8y2, 5y2, 6y1 + 3y2⎬.
x∈X
Modele matematice în economie

Dar y2 = 1 – y1, deci vom calcula:


min⎨-6y1 + 8, -5y1 + 5, 3y1 + 3⎬ pentru y1 ∈ [0, 1].
1
Expresia acestuia este egală cu 3y1 + 3, dacă y1 ∈ [0, ] şi egală cu
4
1
-5y1 + 5, dacă y1 ∈ [ , 1]. În final, avem:
4
1 15
v* = max min ϕ2(x, y) = 3 ⋅ +3= .
y∈Y x∈X 4 4
Soluţia jocului cooperativ dat, în sensul lui Nash, va fi o pereche
15
( u , v ) din S, cu proprietatea ( u , v ) ≥ (2, ) şi care maximizează expresia
4
(u – u*)(v – v*) pentru acele perechi (u, v) cu u ≥ 2 (în cazul în care există
(u, v) ∈ S cu u > u* şi v > v*). Ea va aparţine frontierei Pareto-optimale a
lui S.
Se demonstrează că punctul căutat (unic prin construcţie) are
proprietatea că dreapta tangentă la frontiera lui S, dusă prin el, are panta
(coeficientul unghiular) egală cu opusul pantei dreptei care uneşte (u*,v*)
cu ( u , v ). Evident, această tangentă trebuie să existe, drept pentru care
punctele W12, W22 şi W32 sunt tratate (eventual) separat.
15
Cum coeficientul unghiular al dreptei care uneşte (2, ) cu un
4
(u, v) de pe frontieră este o mărime care variază continuu, analiza decurge
după cum urmează.
Panta dreptei care conţine segmentul [W32W22] (şi care joacă rolul
tangentei la frontiera lui S pentru punctele din interiorul său) este:
5−3
α1 = = -2.
4−5
Teoria jocurilor

15
Unind punctul (2, ) cu (5, 3) se obţine o dreaptă cu panta egală
4
15
3−
cu: 4 = - 1 . Asemănător, dreapta care trece prin punctele (2, 15 ) şi
5−2 4 4
5
(4, 5) are panta egală cu . Aşadar, făcându-l pe (u, v) să varieze în
8
interiorul lui [W32W22] obţinem o dreaptă cu panta β care parcurge
1 5
intervalul (- , ). Cum opusul lui α1 nu se găseşte în această plajă de
4 8
1 5
valori (2 ∉ (- , )), rezultă că ( u , v ) nu aparţine interiorului segmentului
4 8
menţionat.
Continuând analiza cu punctele din interiorul segmentului [W22W12],
8−5
constatăm că panta dreptei – suport a acestuia este α2 = = -3. Dacă
3−4
15 17
unim pe (2, ) cu (3, 8) obţinem o dreaptă având panta egală cu . Deci,
4 4
atunci când (u, v) variază între capetele W22 şi W12, dreapta care îl uneşte cu
5 17
(u*,v*) are panta β ∈ ( , ).
8 4
5 17
În acest caz, - α2 = 3 ∈ ( , ) şi rămâne să îl determinăm pe
8 4
( u , v ) ca un punct situat între W22 şi W12.
Dreapta care trece prin punctele (4, 5) şi (3, 8) are ecuaţia:
v−5 u −4
= ⇔ v = -3u + 17. Ea se va intersecta cu o dreaptă care
3 −1
15
trece prin (2, ), de pantă egală cu β2 = 3, în ( u , v ).
4
Modele matematice în economie

Rezultă sistemul de ecuaţii:


15
v- = 3(u – 2)
4
v = - 3u + 17
9 77
de unde, prin eliminarea lui v, găsim 6u = 17 + şi deci u = ≈ 3.208,
4 24
77 9 59
iar v = 3 ⋅ - = = 7.375.
24 4 8
Soluţia de tip Nash a jocului cooperativ considerat mai sus este
77 59
perechea de câştiguri ( u , v ) = ( , ).
24 8
La acest moment se cuvine a fi făcută o observaţie referitoare la
transferul câştigurilor. Astfel, din ecuaţia:
v = -3u + 17, rezultă că o unitate valorică cedată de P1 se transferă
în 3 unităţi valorice ale lui P2, deoarece avem:
-3(u – 1) + 17 = -3u + 17 + 3 = v + 3.
Putem vorbi deci de o rată de transfer a câştigurilor de la P1 către
P2, egală cu 3(3 la 1).
Să facem diferenţele între câştigul dat de soluţia Nash şi valoarea
maximin pentru fiecare jucător în parte:
77 29 59 15 29
-2= ; − =
24 24 8 4 8
29 29
Raportul lor (în ordinea P2 / P1) este ÷ = 3, deci coincide cu
8 24
rata de transfer. Aceasta ne arată că părţile de câştig obţinute prin cooperare,
în plus faţă de câştigul maximin, de către fiecare jucător, se situează într-o
proporţie egală cu rata de transfer în punctul ( u , v ).
Teoria jocurilor

Să nu pierdem din vedere faptul că scopul fiecărui jucător este ca să-


şi îmbunătăţească câştigul, inclusiv prin cooperare, dar neexcluzând
influenţele subiective. În acest context, putem observa că suma câştigurilor
Nash:
u + v ≈ 3.208 + 7.375 = 10.583,
este strict inferioară sumei 3 + 8 = 11 ce rezultă dacă cei doi jucători convin
să aplice strategiile A1 şi B2, respectiv. Diferenţa rezultată ar putea să fie
obiectul unui transfer de câştig în scopul amintit. Trebuie să acceptăm din
această cauză concluzia că soluţia Nash nu e cea mai bună?
Să observăm că în calculele de mai sus nu am ţinut seama de rata de
transfer, egală cu 3 pentru toţi (u, v) ∈ [W12, W22]. Acestea ar fi trebuit să
arate astfel (în unităţi ale lui P2):
3 × 3 + 1 × 8 = 9 + 8 = 17
3 × 3.208 + 1 × 7.375 = 9.624 + 7.375 = 16.999 ≈ 17.
În încheiere să menţionăm că există şi un alt mod de producere a
soluţiei jocului cooperativ, bazat pe aşa-numitele strategii de ameninţare.
Pentru lămuriri, îndrumăm cititorul către referinţele bibliografice date.

5. Jocuri de n persoane. Valoare Shapley

În cele ce urmează vom considera jocul de n persoane, în care notăm


cu N = ⎨1, 2, ..., n⎬ mulţimea tuturor jucătorilor şi presupunem permisă
cooperarea între aceştia.
Definiţia 1. Orice submulţime nevidă a lui N (inclusiv N şi toate
submulţimile formate dintr-un singur jucător) se numeşte coaliţie.
Modele matematice în economie

Definiţia 2: Se numeşte funcţie caracteristică a unui joc de n jucători


funcţia v, definită pe mulţimea părţilor lui N, care asociază fiecărei coaliţii
S ⊂ N valoarea maximin (corespunzătoare lui S) a jocului de două persoane
jucat între coaliţiile S şi N – S.
Deci notăm prin v(S) câştigul pe care jucătorii din S îl pot obţine în
joc (acţionând în cooperare), indiferent de ceea ce fac restul jucătorilor.
Prin definiţie vom considera:
v(Φ) = 0 (1)
Dacă S şi T sunt coaliţii disjuncte, unindu-şi forţele, ele pot realiza
un câştig cel puţin tot atât ca în cazul când acţionează separat. Acest lucru se
scrie astfel:
v(S ∪ T) ≥ v(S) + v(T), dacă S ∩ T = Φ (2)
şi înseamnă că funcţia caracteristică v are proprietatea de superaditivitate.
Dacă în jocul de două persoane elementul esenţial era studiul
strategiilor mixte, în jocul de n persoane acest element esenţial este
formarea de coaliţii. Funcţia caracteristică dă posibilităţile diferitelor coaliţii
şi este cea mai potrivită pentru studiul acestora.
Definiţia 3: Prin joc de n persoane în formă caracteristică se
înţelege o funcţie v cu valori reale definită pe submulţimile lui N şi care
satisface condiţiile (1) şi (2).
Prin definiţie, v(S) este valoarea maximin a jocului între S şi N - S.
Dacă presupunem că jocul este cu sumă constantă, adică suma câştigurilor
tuturor jucătorilor este constantă, indiferent de desfăşurarea jocului, atunci:
v(S) + v(N-S) = v(N).
v(N) este valoarea ce se poate obţine prin cooperare generală şi se mai
numeşte valoare totală.
Teoria jocurilor

Notăm cu v(⎨i⎬) valoarea pe care jucătorul i o poate obţine acţionând


independent. Evident jucătorul i va intra în coaliţia S dacă valoarea
câştigului este cel puţin v(⎨i⎬).
Definiţia 4: Într-un joc v de n persoane vectorul x = (x1, ..., xn), cu
condiţiile:

a) ∑x
i∈N
i = v(N) şi

b) xi ≥ v(⎨i⎬), (∀) i ∈ N, se numeşte imputaţie.


Evident, din a) şi b), rezultă că:

v(N) ≥ ∑ v({}i ) .
i∈N

Definiţia 5: Un joc v se numeşte esenţial, dacă

v(N) > ∑ v({}i )


i∈N
şi neesenţial în caz contrar.

Jocurile esenţiale sunt acelea ce prezintă interes.


Deoarece jocurile în forma caracteristică (definiţia 3) sunt funcţii cu
valori reale, are sens să vorbim despre suma a două sau mai multe jocuri.
Definiţia 6: Se numeşte suport al unui joc v o coaliţie T cu
proprietatea:
v(S) = v(S ∩ T) pentru orice coaliţie S.
Aceasta înseamnă că orice jucător care nu aparţine unui suport al
jocului este lipsit de importanţă, adică nu aduce nimic unei coaliţii.
Definiţia 7: Fie v un joc de n persoane şi π o permutare arbitrară a
mulţimii N. Prin πv înţelegem jocul obţinut din v în care s-au interschimbat
rolurile jucătorilor prin permutarea π.
Modele matematice în economie

Axiomele Shapley
Numim valoare a unui joc v de n persoane, vectorul
ϕ[v] = (ϕ1[v],..., ϕn[v]), unde ϕi[v] reprezintă partea care trebuie atribuită

jucătorului i, i = 1, n , din câştigul total v(N), cu proprietăţile:

a1) pentru orice suport S al lui v avem: ∑ ϕ [v] = v(S) ;


i∈S
i

a2) pentru orice permutare π şi orice jucător i ∈ N, ϕπ(i)[πv] = ϕi[v];


a3) pentru oricare două jocuri u şi v avem: ϕ[u + v] = ϕ[u] + ϕ[v].
Aceste trei proprietăţi sunt axiomele lui Shapley şi ele sunt suficiente
pentru a determina o funcţie valoare ϕ, definită pentru toate jocurile. Dăm
fără demonstraţie următoarea:
Teoremă [16]
Există o funcţie unică ϕ, definită pentru toate jocurile, care satisface
axiomele a1, a2, a3 şi anume:
( t − 1)!(n − t )!
ϕi[v] = ∑ [v(T) − v(T − {}
i )] (3)
T⊂ N n!
i∈T

unde t este numărul jucătorilor din coaliţia T.


Semnificaţia termenului v(T) – v(T - ⎨i⎬) este câştigul primit de
jucătorul i, sau valoarea cu care acest jucător contribuie la câştigul total al
coaliţiei T din care face parte.
Dacă vom presupune că termenul v(T) – v(T - ⎨i⎬) poate lua numai
valorile 0 sau 1, şi anume ia valoarea 1 dacă şi numai dacă T este o coaliţie
câştigătoare, dar T - ⎨i⎬ nu este câştigătoare, atunci jocul v este un joc
simplu, iar formula (3) se simplifică, astfel:
( t − 1)!(n − t )!
ϕi[v] = ∑
T⊂ N n!
(4)
i∈T
Teoria jocurilor

unde sumarea se face pentru toate coaliţiile câştigătoare T pentru care


T - ⎨i⎬ nu este câştigătoare.
Aplicaţie [16]
O societate pe acţiuni are 4 acţionari ce posedă respectiv 10, 20, 30
şi 40% din acţiuni. Toate deciziile privind activitatea societăţii se iau cu
majoritatea simplă (cel puţin 51% voturi, care sunt proporţionale cu numărul
de acţiuni posedate). Considerând această situaţie ca un joc simplu de 4
persoane se cere:
a) să se găsească toate coaliţiile câştigătoare;
b) să se scrie coaliţiile câştigătoare T pentru care T - ⎨1⎬ nu este
câştigătoare;
c) să se determine valoarea Shapley ϕ = (ϕ1, ϕ2, ϕ3, ϕ4), unde ϕi este

partea ce se atribuie jucătorului i, i = 1,4 , din câştigul total;


d) să se facă observaţii asupra rezultatului obţinut la punctul c).

Rezolvare
a) Coaliţiile câştigătoare sunt:
⎨2, 4⎬, ⎨3, 4⎬, ⎨1, 2, 3⎬, ⎨1, 2, 4⎬, ⎨1, 3, 4⎬, ⎨2, 3, 4⎬, ⎨1, 2, 3, 4⎬.
b) Dintre coaliţiile câştigătoare ce îl conţin pe primul acţionar
singura care devine necâştigătoare când este scos din coaliţie acesta este
coaliţia: ⎨1, 2, 3⎬, în care t (numărul acţionarilor) este egal cu 3.
c) Aplicând formula (4), unde t = 3, n = 4, i = 1, avem:
2!1! 1
ϕ1 = = .
4! 12
Analog, coaliţiile câştigătoare, care îşi pierd această proprietate dacă
acţionarul 2 este înlăturat sunt:
⎨2, 4⎬, ⎨1, 2, 3⎬,⎨1, 2, 4⎬.
Modele matematice în economie

Formula (4) va da pentru ϕ2 suma a trei termeni, fiecare


corespunzând uneia din coaliţiile de mai sus.
Astfel pentru coaliţia ⎨2, 4⎬, t = 2, n = 4, i = 2, primul termen din (4)
va fi:
(2 − 1)! (4 − 2)! 1
= .
4! 12
Pentru ⎨1, 2, 3⎬, t = 3, n = 4, i = 2, obţinem:
(3 − 1)! (4 − 3)! 1
= .
4! 12
Iar pentru ⎨1, 2, 4⎬, t = 3, n = 4, i = 2, aceeaşi valoare ca mai sus,
1
adică . Atunci:
12
1 1 1 1
ϕ2 = + + = .
12 12 12 4
Procedând similar vom obţine:
1 5
ϕ3 = şi ϕ4 = .
4 12
Astfel valoarea Shapley este vectorul:
1 1 1 5
ϕ=( , , , ).
12 4 4 12
Observaţie: ϕ este o imputaţie deoarece satisface condiţiile
definiţiei 4.
d) Valoarea Shapley nu concordă cu vectorul voturilor dat de
1 1 3 2
( , , , ) ale cărui componente sunt proporţionale cu numărul
10 5 10 5
acţiunilor deţinute.
Astfel ϕ2 = ϕ3 deşi acţionarul 3 posedă mai multe acţiuni ca
acţionarul 2. Acţionarul 3 nu are posibilităţi mai mari decât acţionarul 2 de a
Teoria jocurilor

participa la o coaliţie câştigătoare. Importanţa acţionarului 4 este mai mare


decât cea corespunzătoare procentului acţiunilor sale, iar a jucătorului 1 este
mai mică decât cea corespunzătoare acţiunilor sale.
Dacă acţionarii ar deţine respectiv 10, 30, 30, 30% din acţiuni,
oricare doi dintre acţionarii 2, 3, 4 pot forma coaliţii câştigătoare în timp ce
acţionarul 1 este lipsit de orice importanţă neputând aduce nimic nici unei
coaliţii. Atunci valoarea jocului este vectorul:
1 1 1
ϕ = (0, , , ).
3 3 3

6. Probleme

1. Să se stabilească valoarea jocului şi strategiile pure optime pentru


jocul:
B
B1 B2 B3 B4 αi
A
A1 -4 4 2 11 -4
A2 8 6 5 7 5
A3 -1 0 1 -4 -4
βj 8 6 5 11

Rezolvare
Luând αi = min aij, i = 1,3 , βj = max aij, j = 1,4 , completăm
1≤ j≤ 4 1≤ i ≤ 3

coloanele αi, respectiv βj. Şi deoarece α = max αi = 5 = α2, iar β = min βj =


1≤ i ≤ 3 1≤ j≤ 4

= 5 = β3 rezultă că jocul are punct şa, iar strategiile pure optime ale celor doi
jucători sunt respectiv A2 şi B3, iar valoarea jocului v = a23 = 5.
Modele matematice în economie

2. Să se rezolve jocul de ordinul 2 × 2 cu matricea:


⎛ −1 1⎞
A = ⎜⎜ ⎟⎟ , pe cale matriceală.
⎝ 6 0⎠

Rezolvare
Jocul nu are punct şa deoarece 6 şi 1 nu sunt minime pe liniile lor.
Vom folosi relaţiile (9) de la 2.3.a. Cum ⎪A⎪ = -6 ≠ 0 şi:
⎛ 0 − 1⎞ ⎛ 0 − 1⎞
A* = ⎜⎜ ⎟⎟ , JA* = (1, 1) ⎜⎜ ⎟⎟ = (-6, -2);
⎝ − 6 − 1⎠ ⎝ − 6 − 1⎠
⎛ 0 − 1⎞ ⎛1⎞ ⎛ − 1 ⎞ ⎛1⎞
A*JT = ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ , JA*JT = (-6, -2) ⎜⎜ ⎟⎟ = -8
⎝ − 6 − 1 ⎠ ⎝1⎠ ⎝ − 7 ⎠ ⎝1⎠
rezultă că:
JA * 1 ⎛3 1⎞
x= T
= − (−6,−2) = ⎜ , ⎟
JA * J 8 ⎝ 4 4⎠
A * JT 1 ⎛ −1⎞ ⎛ 1/ 8 ⎞ 1 7
yT = = − ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ , de unde y = ( , )
JA * J T
8 ⎝ − 7 ⎠ ⎝ 7 / 8⎠ 8 8
|A| −6 3
v= = = .
JA * J T
−8 4

3. Să se rezolve pe cale grafică jocul a cărui matrice este:


⎛ 6 − 2⎞
⎜ ⎟
⎜5 1 ⎟
⎜3 4 ⎟
⎜ ⎟
⎜ −1 5 ⎟
⎜ 2 − 2⎟
⎝ ⎠
Teoria jocurilor

Rezolvare
Observăm că linia a cincea este dominată de linia a treia, deci vom
renunţa la linia a cincea şi jocul va fi de forma 4 × 2,
⎛ 6 − 2⎞
⎜ ⎟
⎜5 1 ⎟
A= ⎜ .
3 4 ⎟
⎜ ⎟
⎜ −1 5 ⎟
⎝ ⎠
Strategiile jucătorului P2 verifică relaţiile:
6y1 – 2y2 ≤ v
5y1 + y2 ≤ v
3y1 + 4y2 ≤ v
-y1 + 5y2 ≤ v
y1 + y2 = 1
Punând y1 = 1 – y2 în primele 4 inegalităţi, acestea devin:
6 – 8y2 ≤ v
5 – 4y2 ≤ v
y2 + 3 ≤ v
6y2 – 1 ≤ v
şi sunt reprezentate grafic mai jos:
v
6
5 (d4) 5
M 4
(d3)
3

(d2)
1 y2
-1
-2
(d1)
Modele matematice în economie

unde am asociat fiecărei inegalităţi (i), dreapta di, i = 1,4 , ce împarte


semiplanele determinate de inegalitatea (i). Porţiunea din plan cuprinsă între
y2 = 0 şi y2 = 1 (y2 este o probabilitate), şi dedesubtul liniei frânte îngroşate
conţine mulţimea punctelor (y2, v) ce verifică cele 4 inegalităţi. Linia
îngroşată conţine punctele cu cea mai mare valoare a lui v, iar dintre acestea
punctul cu cea mai mică valoare dintre cele de pe linia frântă este
M = d2 ∩ d3 şi deci va avea coordonatele date de soluţia sistemului:
5 – 4y2 = v
y2 + 3 = v
2 3
de unde y2 = , y1 = iar v = 3, 4, deci y2 şi v satisfac restricţiile 2 şi 3 cu
5 5
egalităţi. Teorema ecarturilor ne spune că atunci componentele x2 şi x3 din
problema duală vor fi pozitive.
3 2
Deci strategia lui P2 este y = ( , ).
5 5
Soluţia optimă a jucătorului P1 verifică relaţiile:
6x1 + 5x2 + 3x3 – x4 ≥ v
-2x1 + x2 + 4x3 + 5x4 ≥ v
x1 + x2 + x3 + x4 = 1
în care x2, x3 > 0 iar x1 = x4 = 0. Atunci eliminând prima şi a patra linie din
A va rezulta un joc redus cu matricea:
⎛5 1⎞
A1 = ⎜⎜ ⎟⎟ .
⎝ 3 4⎠
Determinarea strategiei lui P1 o vom face cu ajutorul formulelor (9)
din 2.3.a, unde:
⎛ 4 − 1⎞ ⎛ 4 − 1⎞
⎪A1⎪ = 17; A 1* = ⎜⎜ ⎟⎟ ; JA 1* = (1,1) ⎜⎜ ⎟⎟ = (1, 4);
⎝ − 3 5 ⎠ ⎝− 3 5 ⎠
Teoria jocurilor

⎛1⎞
JA 1* JT = (1, 4) ⎜⎜ ⎟⎟ = 5 deci:
⎝1⎠
JA1* 1 1 4 1 4
x= * T
= (1, 4) = ( , ), deci x2 = , x3 = şi strategia lui
JA1 J 5 5 5 5 5
1 4
P1 este x = (0, , , 0).
5 5

4. Să se determine prin metodele cunoscute valoarea jocului şi


strategiile jucătorilor pentru cazul în care matricea plăţilor este:

⎛4 0 − 2 − 1⎞
⎜ ⎟
⎜1 3 4 5⎟
⎜2 .
3 1 1⎟
⎜ ⎟
⎜ −1 1 2 3 ⎟⎠

Rezolvare
Aplicând principiul strategiilor dominate observăm că linia a doua
are elementele respectiv mai mari ca linia a patra, deci o vom şterge pe
aceasta din urmă. Coloana a treia domină coloana a patra, care va fi ştearsă
şi matricea jocului se va restrânge la:
⎛ 4 0 − 2⎞
⎜ ⎟
A = ⎜1 3 4 ⎟ .
⎜2 3 1 ⎟
⎝ ⎠

Cercetăm dacă jocul este cu punct şa, adăugând matricei A coloana


αi (a celor mai mici elemente pe linie) şi linia βj (a celor mai mari elemente
pe coloană).
Modele matematice în economie

Obţinem:
B1 B2 B3 αi
A1 4 0 -2 -2
A2 1 3 4 1
A3 2 3 1 1
βj 4 3 4

de unde α = maxαi = 1, β = minβj = 3, deci α ≠ β, jocul nu are punct şa, iar


valoarea jocului v ∈ (1, 3).
a) Rezolvăm întâi problema pe cale matriceală, folosind formulele
(9’) din observaţia dată în paragraful 2.3.a.
⎪A⎪ = -30;
⎛− 9 − 6 6 ⎞

⎜ ⎟
A = ⎜ 7 8 − 18 ⎟
⎜ − 3 − 12 12 ⎟
⎝ ⎠
JA ∗ = (− 5,−10, 0 ); A ∗ J T = (− 9, − 3, − 3); JA ∗ J T = −15

JA ∗ 1 ⎛1 2 ⎞
x= ∗ T
= − (− 5; − 10, 0 ) = ⎜ , , 0 ⎟
JA J 15 ⎝3 3 ⎠
A∗J∗ 1 ⎛3 1 1⎞
J= ∗ T
= − (− 9, − 3, − 3) = ⎜ , , ⎟
JA J 15 ⎝5 5 5⎠
A − 30
v= ∗ T
= =2
JA J − 15
Aplicăm procedeul din observaţia mai sus citată şi verificăm criteriul
lui Neumann, astfel:
⎛ 4 0 − 2⎞
⎛1 2 ⎞ ⎜ ⎟
x A = ⎜ , , 0 ⎟ ⋅ ⎜1 3 4 ⎟ = (2, 2, 2 ) = 2J
⎝3 3 ⎠ ⎜ ⎟
⎝2 3 1 ⎠
Teoria jocurilor

⎛ 4 0 − 2 ⎞ ⎛ 3 / 5⎞ ⎛ 2 ⎞
⎜T ⎟ ⎜ ⎟ ⎜ ⎟
A y = ⎜1 3 4 ⎟ ⋅ ⎜1 / 5 ⎟ = ⎜ 2 ⎟ = 2 J T
⎜ 2 3 1 ⎟ ⎜1 / 5 ⎟ ⎜ 2 ⎟
⎝ ⎠ ⎝ ⎠ ⎝ ⎠

Deci x şi y sunt o soluţie a jocului cu v = 2 .


b) Rezolvăm problema prin programare liniară. Modelul matematic
al jocului scris din punctul de vedere al celui de al doilea jucător cu strategia
y = (y1 , y 2 , y 3 ) , va fi:

4 y1 − 2y 3 ≤ v
y 1 + 3y 2 + 4 y 3 ≤ v
2 y 1 + 3y 2 + y 3 ≤ v
y1 + y 2 + y 3 = 1; y j ∈ [0,1], j = 1,3 .

Cum v ∈ (1,3) deci este pozitiv, împărţim relaţiile de mai sus prin v
şi notăm:
yj
Yj = , j = 1,3
v
Deoarece P2 urmăreşte să facă minim v, atunci va dori să facă maxim
1
şi obţinem:
v
1
[max]g = = Y1 + Y2 + Y3
v
4Y1 − 2Y3 ≤ 1
Y1 + 3Y2 + 4Y3 ≤ 1
2Y1 + 3Y2 + Y3 ≤ 1
Yj ≥ 0 , j = 1,3

Aducem problema la forma standard şi aplicăm algoritmul simplex.


Modele matematice în economie

4Y1 − 2Y3 + Y4 = 1
Y1 + 3Y2 + 4Y3 + Y5 = 1
2Y1 + 3Y2 + Y3 + Y6 = 1
Yj ≥ 0 , j = 1,6

1
[max]g = = Y1 + Y2 + Y3 + 0 (Y4 + Y5 + Y6 ) .
v

1 1 1 0 0 0
B CB YB θ
a1 a2 a3 a4 a5 a6
a4 0 1 4 ↓ 0 -2 1 0 0
a5 0 1 1 3 4 0 1 0
a6 0 1 2 3 1 0 0 1
gj 0 0 0 0 0 0 0 0
∆j=cj-gj 1 1 1 0 0 0
a1 1 1/4 1 0 -1/2↓ 1/4 0 0 -
a5 0 3/4 0 3 9/2 -1/4 1 0 1/6
a6 0 2/4 0 3 2 -1/2 0 1 1/4
gj 1/4 1 0 -1/2 1/4 0 0
∆j=cj-gj 0 1 3/2 -1/4 0 0
a1 1 1/3 1 1/3 0 2/9 1/9 0
a3 1 1/6 0 2/3 1 -1/18 2/9 0
a6 0 1/6 0 5/3 0 -7/18 0 1
gj 1/2 1 1 1 1/6 1/3 0
∆j=cj-gj 0 0 0 -1/6 -1/3 0

Am ajuns la soluţia optimă care va fi:


1 1
max g = = , de unde v = 2 .
v 2
2
Y1 = 1 / 3 , Y3 = 1 / 6 de unde y1 = v Y1 = 2 ⋅ 1 / 3 = ;
3
y 3 = v Y3 = 2 ⋅ 1 / 6 = 1 / 3 , deci strategia lui P2 va fi :
⎛ 2 1⎞
y = ⎜ ,0, ⎟
⎝ 3 3⎠
Teoria jocurilor

1 1
X1 = , X 2 = , X 3 = 0 de unde :
6 3
1 1 2 ⎛1 2 ⎞
x 1 = vX1 = 2 = ; x 2 = ; x 3 = 0 şi x = ⎜ , , 0 ⎟ .
6 3 3 ⎝3 3 ⎠

Observaţie: Prin metoda b) strategia lui P1 este aceeaşi cu cea din a),
dar strategia lui P2 diferă. Acest lucru a apărut deoarece în rezolvarea prin
simplex a problemei, în etapa de optim ∆2 = 0 deşi a2 ∉ B. În acest caz
problema are o infinitate de soluţii. Să mai găsim una continuând simplexul
cu încă o iteraţie prin introducerea în bază a lui a2 şi eliminarea lui a6.
a1 1 3/10 1 0 0 3/10 1/9 -1/5
a3 1 1/10 0 0 1 1/10 2/9 -2/5
a2 1 1/10 0 1 0 -7/10 0 3/5
gj 1/2 1 1 1 1/6 1/3 0
∆j=cj-gj 0 0 0 -1/6 -1/3 0

⎛1 2 ⎞
Obţinem aceeaşi valoare v = 2 şi x = ⎜ , , 0 ⎟ .
⎝3 3 ⎠
3 1 1
Dar Y1 = , Y2 = , Y3 = , ce conduce la:
10 10 10
3 1 1 ⎛3 1 1⎞
y1 = , y 2 = , y 3 = , adică y = ⎜ , , ⎟ soluţie găsită şi prin
5 5 5 ⎝ 5 5 5⎠
metoda a).
Dar dacă o problemă de programare liniară are două soluţii optime:
⎛ 2 1⎞ ⎛ 3 1 1⎞
y′ = ⎜ , 0, ⎟ şi y′′ = ⎜ , , ⎟ ea va avea o infinitate de soluţii optime, date
⎝ 3 3 ⎠ ⎝5 5 5⎠
de combinaţia liniară convexă de y' şi y''. Deci P2 are o infinitate de strategii
date de:
⎛2 1⎞ ⎛3 1 1⎞
y = λy ′ + (1 − λ ) y ′′ = λ⎜ , 0, ⎟ + (1 − λ ) ⎜ , , ⎟ =
⎝3 3⎠ ⎝ 5 5 5⎠
⎛ 9 + λ 1 − λ 3 + 2λ ⎞
=⎜ , , ⎟, 0 ≤ λ ≤ 1.
⎝ 15 5 15 ⎠
Modele matematice în economie

Observaţie: Dacă la metoda matriceală de la punctul a) am fi aplicat


procedeul dat în paragraful 2.3.a, am fi găsit şi altă soluţie pentru jocul
considerat şi orice combinaţie liniară convexă de soluţiile găsite ar fi fost tot
o soluţie a jocului, de unde infinitatea de soluţii dată de algoritmul simplex.

5. Să se rezolve jocul G = (A, B, f) în care matricea plăţilor A este:


B
A B1 B2 B3 B4
A1 3 -1 0 7
A2 6 8 3 5
A3 2 5 1 3

Rezolvare
Determinăm valoarea inferioară şi valoarea superioară ale jocului:
αi = min aij şi v G = max αi = α
1≤ j≤ 4 1≤ i ≤ 3

βj = max aij şi v G = min βj = β


1≤ i ≤ 3 1≤ j≤ 4

Avem:
B
B1 B2 B3 B4 αi
A
A1 3 -1 0 7 -1
A2 6 8 3 5 3
A3 2 5 1 3 1
βj 6 8 3 7

α1 = min⎨3, -1, 0,7⎬ = -1


α2 = min⎨6, 8, 3,5⎬ = 3
α3 = min⎨2, 5, 1,3⎬ = 1
de unde α = max⎨-1, 3, 1⎬ = 3 = v G .

β1 = max⎨3, 6, 2⎬ = 6; β2 = max⎨-1, 8, 5⎬ = 8;
Teoria jocurilor

β3 = max⎨0, 3, 1⎬ = 3; β4 = max⎨7, 5, 3⎬ = 7;

β = min⎨6, 8, 3, 7⎬ = 3 = v G .

Cum vG = v G = 3, rezultă că jocul are punct şa şi P1 va alege numai


strategia A2 iar P2 numai B3, indiferent de numărul partidelor ce se joacă.

6. Să se rezolve jocul matriceal G = (A, B, f) asociat unei situaţii de


concurenţă a două firme, dacă s-a stabilit că matricea jocului este:
B
A B1 B2 B3
A1 0 -5 2
A2 -2 2 -1
A3 1 -1 1

Rezolvare
Determinăm vG şi v G pentru a vedea dacă jocul are punct şa. Avem:
B
A B1 B2 B3 αi
A1 0 -5 2 -5
A2 -2 2 -1 -2
A3 1 -1 1 -1
βj 1 2 2

vG = maxαi = max⎨-5, -2, -1⎬ = -1


v G = minβj = min⎨1, 2, 2⎬ = 1

Din vG ≠ v G rezultă că jocul nu are punct şa şi valoarea lui


v ∈ (-1, 1).
Căutăm strategiile mixte x = (x1, x2, x3) pentru P1 şi y = (y1, y2, y3)
pentru P2, prin intermediul programării liniare.
Mai întâi transformăm elementele matricei A, pentru a avea v > 0.
Modele matematice în economie

E suficient să adunăm 2 la elementele matricei iniţiale şi avem:


⎛ 2 − 3 4⎞
⎜ ⎟
A = ⎜ 0 4 1 ⎟ = (aij + 2).
⎜ 3 1 3⎟
⎝ ⎠

Jocul corespunzător matricei A va avea aceleaşi strategii mixte


optime ca jocul iniţial, doar valoarea jocului este v = v + 2, adică cu 2 mai
mare decât valoarea jocului iniţial.
Pentru P2 problema de programare liniară ce trebuie rezolvată va fi:
2y1 – 3y2 + 4y3 ≤ v

4y2 + y3 ≤ v

3y1 + y2 + 3y3 ≤ v
y1 + y2 + y3 = 1
yj ≥ 0, j = 1,3
yj 1
Cu v > 0, Yj = şi = [max]g, avem:
v v
1
[max]g = = Y1 + Y2 + Y3
v
2Y1 – 3Y2 + 4Y3 + Y4 = 1
4Y2 + Y3 + Y5 = 1
3Y1 + Y2 + 3Y3 + Y6 = 1
Yj ≥ 0, j = 1,6 .

Rezolvăm problema aplicând algoritmul simplex.


Teoria jocurilor

1 1 1 0 0 0
B CB YB θ
a1 a2 a3 a4 a5 a6
a4 0 1 2 -3 ↓ 4 1 0 0 -
a5 0 1 0 4 1 0 1 0 1/4
a6 0 1 3 1 3 0 0 1 1/3
gj 0 0 0 0 0 0 0
∆j=cj-gj 1 1 1 0 0 0
a4 0 7/4 4↓ 0 19/4 1 3/4 0 7/16
a2 1 1/4 0 1 1/4 0 1/4 0 -
a6 0 3/4 3 0 11/4 0 -1/4 1 3/12
gj 1/4 0 1 1/4 0 1/4 0
∆j=cj-gj 1 0 3/4 0 -1/4 0
a4 0 3/4 0 0 13/12 1 13/12 -4/3
a2 1 1/4 0 1 1/4 0 1/4 0
a1 1 1/4 1 0 11/12 0 -1/2 1/3
gj 1/2 1 1 7/6 0 1/6 1/3
∆j=cj-gj 0 0 -1/6 0 -1/6 -1/3

Am ajuns la soluţia optimă care este:


1 1
[max]g = = , de unde v = 2
v 2
y1 1 1 1 1 1
Y1 = = , de unde y1 = 2 = ; Y2 = , de unde y2 = ,
v 4 4 2 4 2
y3 = 0;
1 x1 1 1 1 2
X2 = = , de unde x2 = 2 = ; X3 = , de unde x3 = ;x1 = 0
6 v 6 3 3 3
1 2 1 1
deci: x = (0, , ), y = ( , ,0) iar v = v - 2 = 2 – 2 = 0.
3 3 2 2
Echilibrul realizat se manifestă aici prin anularea câştigului fiecărui
participant.

7. O familie se aprovizionează pentru iarnă cu cărbune de un anumit


tip. Cantitatea necesară şi condiţiile de aprovizionare sunt date în următorul
tabel [10]:
Modele matematice în economie

Cantitatea Preţ
Iarna necesară unitar
în tone u.m./t
Uşoară 4 70
Obişnuită 5 75
Grea 6 80

Dacă aprovizionarea se face vara, preţul unitar este de 60 u.m./t.


Se cere:
a) să se scrie matricea plăţilor ştiind că aprovizionarea se face în
timpul verii;
b) să se decidă strategia prin criteriul maximin;
c) să se decidă strategia prin criteriul minimax;
d) să se decidă strategia prin criteriul Savage;
e) să se decidă strategia când stările iernii sunt egal probabile;
alternativ, când probabilităţile sunt respectiv 0,2; 0,5 şi 0,3;
f) pentru α = 0,75 să se determine strategia optimă prin criteriul
Hurwicz.

Rezolvare
a) Matricea asociată jocului generat de problema dată va fi:
Strategia
iernii uşoară obişnuită grea
Cantitatea S1:4t S2:5t S3:6t
contractată
A1:4t -240 -315 -400
A2:5t -300 -300 -380
A3:6t -360 -360 -360

unde, de exemplu, elementul de pe linia lui A2 şi coloana lui S3 s-a calculat


astfel: s-au cumpărat 5t a câte 60 u.m. pentru care s-au plătit 300 u.m.; iarna
Teoria jocurilor

fiind grea, mai este nevoie de o tonă ce se cumpără iarna cu preţul de 80


u.m., deci în total cheltuielile vor fi de 380 sau în matricea câştigurilor lui P1
vom scrie -380.
b) În aplicarea criteriului maximin se alege minimul elementelor de
pe fiecare linie şi dintre acestea se determină maximul, astfel:
A1 A2 A3
-400 -380 -360

Cel mai mare este -360 şi indică alegerea strategiei A3.


c) Criteriul minimax recomandă alegerea elementului maxim de pe
fiecare linie şi apoi determinarea celui mai mic dintre acestea.
A1 A2 A3
-240 -300 -360

Cel mai mic este -360 şi corespunde strategiei A3.


d) Formăm matricea R a regretelor din A scăzând din cel mai mare
element al unei coloane toate elementele coloanei respective. Obţinem:
⎛ 0 15 40 ⎞
⎜ ⎟
R = ⎜ 60 0 20 ⎟ .
⎜120 60 0 ⎟
⎝ ⎠
Determinăm apoi în R cel mai mare element pe fiecare linie şi apoi
cel mai mic dintre acestea. Obţinem:
A1 A2 A3
40 60 120

Cel mai mic este 60 şi recomandă strategia A2.


Modele matematice în economie

e) În ipoteza că stările Si, i = 1,3 , sunt egal probabile, vom calcula

cheltuielile medii pentru fiecare strategie Ai, i = 1,3 . Astfel:


1 1 1 955
ϕ(1, y) = (-240) + (-315) + (-400) = -
3 3 3 3
980 1080
ϕ(2, y) = - şi ϕ(3, y) = - .
3 3
Cea mai mare dintre aceste sume este ϕ(1, y) şi recomandă A1. Dacă
stările nu sunt egal probabile ci au respectiv probabilităţile: 0,2; 0,5; 0,3,
cheltuielile medii vor fi:
ϕ(1, y) = 0,2(-240) + 0,5(-315) + 0,3(-400) = -325, 5
ϕ(2, y) = 0,2(-300) + 0,5(-300) + 0,3(-380) = -324
ϕ(3, y) = 0,2(-360) + 0,5(-360) + 0,3(-360) = -360
şi cea mai mică cheltuială este ϕ(2, y) şi recomandă A2.
f) Ataşăm matricei iniţiale A coloanele elementelor mi = min aij şi
1≤ j≤ 3

Mi = max aij, apoi coloana elementelor αMi + (1 - α)mi, astfel:


1≤ j≤ 3

Si
S1 S2 S3 mi Mi αMi+(1-α)mi
Ai
A1 -240 -315 -400 -400 -240 160α-400
A2 -300 -300 -380 -380 -300 80α-380
A3 -360 -360 -360 -360 -360 -360

Pentru α = 0,75, corespunzător lui A1, obţinem pe ultima coloană


160 ⋅ 0,75 – 400 = - 280; pentru A2, 80 ⋅ 0,75 – 380 = -320 şi pentru A3,
- 360. Cea mai mică cheltuială este pentru A1.
Teoria jocurilor

8. Să se elimine strategiile dominate şi să se cerceteze existenţa


punctelor de echilibru Nash (în strategii pure) pentru următorul joc
bimatriceal.
P2
B1 B2 B3 B4
P1
A1 (5,4) (3,1) (9,0) (4,2)
A2 (2,7) (3,4) (1,3) (0,1)
A3 (6,8) (1,3) (0,2) (3,5)
A4 (3,2) (4,7) (2,4) (2,6)

Rezolvare
Se observă mai întâi că strategia A4 a jucătorului P1 domină strict
strategia A2 (oricare ar fi strategia de răspuns Bj a lui P2, avem a4j > a2j).
După eliminarea lui A2, care nu afectează punctele de echilibru, observăm
că strategia B4 a lui P2 domină strict pe B3 (deoarece 2 > 0, 5 > 2 şi 6 > 4).
După ce B3 este suprimată şi ea, obţinem un tabel restrâns.
B1 B2 B4
A1 (5,4) (3,1) (4,2)
A3 (6,8) (1,3) (3,5)
A4 (3,2) (4,7) (2,6)

În această fază nu vom mai găsi strategii dominate. Urmând


procedura de determinare a răspunsurilor optime, pe linii şi pe coloane, vom
obţine marcările de mai jos:
B1 B2 B4
A1 (5,4) (3,1) (4,2)
A3 (6,8) (1,3) (3,5)
A4 (3,2) (4,7) (2,6)

Cum singurele perechi de câştiguri cu două sublinieri sunt (6,8) şi


(4,7), rezultă că (A3, B1) şi (A4, B2) sunt puncte de echilibru ale jocului (în
strategii pure). Observând câştigurile corespunzătoare, se poate spune că
Modele matematice în economie

(A3, B1) este preferabil lui (A4, B2) pentru ambii jucători şi deci poate
constitui soluţia jocului.

9. Să se construiască un joc bimatriceal care să admită un punct de


echilibru format din strategii pure de tip maximin.

Rezolvare
Fie jocul cu sumă arbitrară dat prin matricea:
B1 B2
A1 (4,5) (3,4)
A2 (2,6) (5,7)

Se observă, fără dificultate, că (A1, B1) şi (A2, B2) sunt puncte de


echilibru Nash al jocului. În acelaşi timp, avem valorile maximin:
max min aij = max⎨min⎪⎨4,3⎬, min⎨2,5⎬⎬ = max⎨3,2⎬ = 3
i =1, 2 j=1, 2

max min bij = max⎨min⎪⎨5,6⎬, min⎨4,7⎬⎬ = max⎨5,4⎬ = 5


i =1, 2 j=1, 2

Deci A1 e strategia maximin a lui P1 şi B1 e strategia maximin a lui


P2. Se confirmă, pe de altă parte, faptul că orice punct de echilibru îi promite
fiecărui jucător un câştig mai mare sau egal cu valoarea maximin
corespunzătoare lui a jocului.

10. Să se arate că jocul în formă normală de mai jos nu admite


puncte de echilibru Nash în strategii mixte:
B1 B2 B3
A1 (1,0) (1,2) (0,1)
A2 (0,3) (0,1) (2,0)
Teoria jocurilor

Rezolvare
Fie (p, q, 1 – p – q) o strategie mixtă pe B = ⎨B1, B2, B3⎬.
Avem deci p, q ≥ 0 şi p + q ≤ 1. Căutăm răspunsul optim al lui P1 la
această strategie a lui P2. Dacă P1 foloseşte strategia A1 atunci îi revine un
câştig mediu egal cu p + q, iar dacă foloseşte strategia A2, câştigul mediu
este 2(1 – p – q). Comparându-le, se deduce imediat că dacă p + q ∈ [0, 2/3)
cel mai bun răspuns este A2 în timp ce pentru p + q ∈ (2/3, 1], cel mai bun
răspuns este A1.
2
Cazul p + q = nu face deosebire între A1 şi A2 ca replici optime
3
ale lui P1. Dacă vom considera o strategie mixtă (r, 1 – r) pe A = ⎨A1, A2⎬,
0 ≤ r ≤ 1, câştigurile medii ale lui P2 vor fi egale cu 3 – 3r, r + 1 sau r, după
cum foloseşte strategiile pure B1, B2 sau B3, respectiv. Din inegalităţile
3 – 3r > r + 1 > r reiese că răspunsul optim al lui P2 este B1, pentru
1 1 1
r< şi B2, pentru r > . În cazul r = , se reţin ca cel mai bun răspuns
2 2 2
oricare dintre strategiile B1 sau B2.
Să presupunem că punctele de echilibru ale jocului sunt de forma
((r*, 1 – r*), (p*, q*, 1 – p* - q*)). Vom analiza situaţiile posibile pentru r*:
1
I. Dacă r* ∈ [0, ), răspunsul optim al lui P2 este B1, căruia i-ar
2
corespunde ca strategie mixtă valorile p* = 1, q* = 0, ceea ce
2
înseamnă că p* + q* = 1 > şi, în replică, am avea strategia
3
optimă A1 a lui P1. Cum A1 poate fi identificată cu strategia
mixtă (1, 0), rezultă r* = 1, contrazicând ipoteza iniţială;
Modele matematice în economie

1
II. În cazul r* = , orice strategie mixtă a lui P2 de forma
2
(λ, 1-λ, 0), 0 ≤ λ ≤ 1 este un răspuns optim. Discuţia continuă ca
1
mai înainte şi se ajunge la concluzia r* = 1 ≠ ;
2
1
III. Dacă r* ∈ ( , 1), replica cea mai bună a lui P2 este B2; ei îi
2
2
corespund valorile p* = 0, q* = 1 şi cum p* + q* > , răspunsul
3
1
optim al lui P1 e din nou A1. Obţinem, ca mai sus, r*= 1∉( ,1);
2
IV. Ultima posibilitate, r* = 1 ne conduce la o strategie de răspuns
cu p* = 0, q* = 1 şi, de această dată, cu răspunsul în oglindă al
lui P1, lanţul deducţiilor se închide. Am obţinut astfel un punct
de echilibru în strategii pure, ((1,0), (0,1,0)), fapt ce clarifică
cerinţa problemei vis-à-vis de teorema lui Nash. Să mai
observăm că, deoarece strategia B3 este strict dominată,
componenta corespunzătoare ei într-o strategie optimă a lui P2
nu putea fi decât nulă.

11. ([12]) Două firme cu profile asemănătoare de activitate oferă


fiecare câte un loc de muncă. Să presupunem că se plătesc salarii diferite:
firma i plăteşte salariul si, unde (1/2) s1 < s2 < 2s1. Să presupunem că există
doi lucrători ce doresc să se angajeze, dar fiecare nu poate opta decât pentru
o singură firmă, acest lucru făcându-se simultan. Dacă numai câte un singur
lucrător îşi oferă serviciile unei firme, el este angajat.
Dacă ambii lucrători optează pentru aceeaşi firmă, aceasta angajează
pe unul dintre ei, la întâmplare, iar celălalt rămâne, pe mai departe, fără
serviciu (şi cu o plată presupusă nulă). Să se găsească soluţia în strategii de
echilibru Nash a acestui joc.
Teoria jocurilor

Rezolvare
Vom construi pentru început forma normală a jocului descris.
Jucătorii sunt cei doi lucrători, strategiile lor constând din opţiunile pe care
le fac pentru firma 1 sau firma 2 şi pe care le notăm cu A1, A2, respectiv B1,
B2. Vom nota, ca de obicei, cu f1(⋅,⋅) şi f2(⋅,⋅) respectiv, funcţiile de câştig ale
jucătorilor. Considerând utilităţile imediate ale celor doi lucrători, rezultate
în urma alegerilor făcute, putem construi următoarea matrice de plăţi (în
ipoteza şanselor egale):
B1 B2
A1 1 1 (s1,s2)
( s1, s1)
2 2 1 1
A2 ( s2, s2)
(s2,s1) 2 2

1 1
Ţinând seama de ipotezele s1 < s2 şi s2 < s1, vom putea scrie:
2 2
1
f1(A1, B2) = s1 > s2 = f1(A2, B2)
2
1
f2(A1, B2) = s2 > s1 = f2(A1, B1)
2
de unde rezultă că (A1, B2) este punct de echilibru Nash.
Asemănător, obţinem relaţiile:
1
f1(A2, B1) = s2 > s1 = f1(A1, B1)
2
1
f2(A2, B1) = s1 > s2 = f2(A2, B2)
2
ceea ce arată că şi (A2, B1) este un punct de echilibru Nash.
Faptul că fiecare lucrător este angajat dacă se optează pentru una sau
cealaltă dintre perechile de strategii discutate vine în acord cu ideea de
echilibru, chiar dacă unul dintre jucători poate să nu fie mulţumit pe deplin
cu salariul pe care îl obţine.
Modele matematice în economie

Dacă fiecare jucător ţine la şansa sa de a fi angajat şi de a primi un


salariu mai bun, atunci are sens considerarea strategiilor mixte.
Fie (y, 1-y) o strategie mixtă a lui P2. Atunci câştigul mediu al lui P1
va fi dat de:
1 1
ys1 + (1 – y)s1 = s1 - ys1, sau
2 2
1 1 1
ys2 + (1 – y) s2 = s2 + ys2, după cum foloseşte strategia pură
2 2 2
A1 sau A2.
1 1 1
Din inegalitatea s1 - ys1 > s2 + ys2, rezultă că pentru
2 2 2
⎡ 2s − s ⎞
y ∈ ⎢0, 1 2 ⎟⎟ cel mai bun răspuns al lui P1 la strategia mixtă a lui P2 este
⎣ s1 + s 2 ⎠
⎛ 2s − s
A1, iar pentru y ∈ ⎜⎜ 1 2 ,1] , acesta este A2 (să observăm că s1 < 2s2 e
⎝ s1 + s 2
echivalent cu 2s1 – s2 < s1 + s2).
O analiză similară se face pornind de la o strategie mixtă (x, 1 – x)
pe ⎨A1, A2⎬. Urmând procedeul de rezolvare descris în soluţia la problema
10, vom obţine următorul punct de echilibru Nash în strategii mixte:
⎛ ⎛ 2s1 − s 2 2s 2 − s1 ⎞ ⎛ 2s1 − s 2 2s 2 − s1 ⎞ ⎞
⎜⎜ ⎟⎜ ⎟⎟
⎜ ⎜ s + s , s + s ⎟, ⎜ s + s , s + s ⎟ ⎟ .
⎝ ⎝ 1 2 1 2 ⎠ ⎝ 1 2 1 2 ⎠⎠
Desigur că în acest exemplu de joc nu se pune problema repetării
sale de un număr de ori care să permită alternarea strategiilor.
Metoda de decizie pentru oricare jucător este să folosească un
generator de numere aleatoare (de tipul funcţiei RND a unui calculator de
2s1 − s 2
buzunar); dacă valoarea generată se găseşte în intervalul (0, ),
s1 + s 2
atunci el va alege strategia A1(B1), altfel va juca A2(B2).

Anda mungkin juga menyukai