Teoria gier/Gry dwuosobowe suma zero

Z Skrypty dla studentów Ekonofizyki UPGOW

(Różnice między wersjami)
(Strategie mieszane)
(Rozwiązania gier typu (mx2) i (2xn))
 
(Nie pokazano 1 wersji pomiędzy niniejszymi.)
Linia 659: Linia 659:
;Przykład
;Przykład
-
:Jeśli w grze '''2.6''' Kolumna zagra opcję A z prawdopodobieństwem <math>pK_A=1/2\,</math> i B z prawdopodobieństwem <math>pK_B=1/2\,</math> czyli wybierze strategię <math>[1/2, 1/2]_K\,</math> to ''wartość oczekiwana wypłaty Wiersza przy wyborze opcji A'', którą oznaczamy <math>EW_A\,</math>, wynosi
+
:Jeśli w grze '''2.6''' Kolumna zagra opcję A z prawdopodobieństwem <math>pK_A=1/2\,</math> i B z prawdopodobieństwem <math>pK_B=1/2\,</math> czyli wybierze strategię <math>[1/2, 1/2]_K\,</math> to ''wartość oczekiwana wypłaty Wiersza przy wyborze opcji A'', którą oznaczamy <math>\mathbb EW_A\,</math>, wynosi
:<math>\mathbb EW_A=\frac {1}{2} \cdot 1 + \frac {1}{2} \cdot(-2) = -\frac {1}{2}</math>,
:<math>\mathbb EW_A=\frac {1}{2} \cdot 1 + \frac {1}{2} \cdot(-2) = -\frac {1}{2}</math>,
Linia 996: Linia 996:
:<math>\mathbb EW_A=\mathbb EW_B=\mathbb EW \,</math>
:<math>\mathbb EW_A=\mathbb EW_B=\mathbb EW \,</math>
-
czyli leżeć na prostej o tym równaniu nachylonej pod kątem <math>\pi/2</math> do osi <math>\mathbb EW_A\,</math> (czerwona przerywana linia). Wszystkie punkty otoczki leżące na tej prostej są strategiami wyrównującymi Kolumny. Ona jednak jest zainteresowana minimalizacją wygranej Wiersza a zatem wybierze strategię oznaczoną literą "S". Ta strategia leży na krawędzi otoczki wyznaczonej przez wypłaty opcji A i D Kolumny. Jak zatem widać z rysunku Kolumna powinna całkowicie odrzucić strategie B oraz C, które dają wyższe wygrane Wierszowi i powinna zagrać strategię mieszaną "S" wyznaczoną przez równanie
+
czyli leżeć na prostej o tym równaniu nachylonej pod kątem <math>1/2</math> do osi <math>\mathbb EW_A\,</math> (czerwona przerywana linia). Wszystkie punkty otoczki leżące na tej prostej są strategiami wyrównującymi Kolumny. Ona jednak jest zainteresowana minimalizacją wygranej Wiersza a zatem wybierze strategię oznaczoną literą "S". Ta strategia leży na krawędzi otoczki wyznaczonej przez wypłaty opcji A i D Kolumny. Jak zatem widać z rysunku Kolumna powinna całkowicie odrzucić strategie B oraz C, które dają wyższe wygrane Wierszowi i powinna zagrać strategię mieszaną "S" wyznaczoną przez równanie
:<math>
:<math>

Aktualna wersja na dzień 14:32, 16 paź 2012

Spis treści

Gry dwuosobowe o sumie zerowej

Gry oraz diagramy przesunięć

Gra
Przez grę rozumiemy zespół zasad określający wypłatę dla graczy jako funkcje wybranych opcji, które są możliwe dla danej gry.

Aby mówić o grze musimy wskazać co najmniej dwu graczy. Każdy z tych graczy ma możliwość wyboru spośród pewnej liczby możliwych opcji. Gracze podejmują swoje decyzję równocześnie lub, co na to samo wychodzi, nie znając wyborów pozostałych graczy - taką grę nazywamy symultaniczną. Mogą też wybierać swoje opcje jako odpowiedź na wybór dokonany przez pozostałych graczy, w takim przypadku mówimy o grach sekwencyjnych. Gra może składać się z jednej lub wielu rund, w trakcie których gracze dokonują swoich wyborów. Przez strategię, jak już to wspomnieliśmy we wstępie, rozumiemy przyjęty przez gracza sposób wybierania jednej z możliwych opcji. Strategie mogą być proste, wówczas gracz po prostu wybiera jedną opcję lub mieszane, wówczas gracz decyduje się na wybór kilku opcji z określeniem prawdopodobieństwa wyboru każdej z nich.

Jeśli każdej możliwej kombinacji opcji wybranych przez graczy przyporządkujemy (jednoznacznie) wypłatę dla każdego z nich to taki przepis nazywamy zasadą gry. Wypłatą gracza nazywamy mierzalny sposób określenia jego wyniku. Wypłaty zazwyczaj określamy w sposób liczbowy aby ułatwić ich sumowanie i podliczanie wyników gry. Można jednak definiować gry w których wypłaty są dobrami materialnymi, zobowiązaniem do wykonania jakiejś czynności (np. że gracz, który przegra stanie na głowie), etc. Zasady gry mogą być przedstawione w postaci macierzowej tzw. tabeli wypłat. Poniżej przedstawiamy przykładową tabelę.

Przykład 2.1 Tabela gry.
Przykład macierzy wypłat dla gry dwuosobowej
2.1 Basia (Kolumna)
Adam (Wiersz) A B
A 1, -1 -2, 2
B -1, 1 0, 0
C -4, 4 5, -5

Graczami są Adam i Basia. W dalszej części odpersonalizujemy Adama i będziemy go nazywać (panem) Wierszem a Basię (panią) Kolumną. W grze 2.1 Adam ma do wybory trzy opcje (strategie proste): A, B oraz C a Basia dwie strategie: A oraz B. W zależności od dokonanych wyborów uzyskują wypłaty zapisane w tabeli. Wypłaty Adama są oznaczone kolorem niebieskim a wypłaty Basi kolorem czerwonym. Jak łatwo zauważyć wypłaty Adama są zawsze liczbami przeciwnymi do wypłat Basi. Tyle ile jedno z nich wygra drugie musi przegrać. Grę w której mamy do czynienia z taką sytuacją nazywamy grą o sumie zerowej. Dla gier o sumie zerowej przyjmujemy upraszczające konwencję zapisu, w której tabela wypłat zawiera tylko wypłaty Wiersza, wypłaty Kolumny są przeciwne do wypłat wiersza. W przypadku gry 2.1. uproszczona tabela ma postać

Uproszczona macierz pokazująca tylko wypłaty Wiersza
2.1 Kolumna
Wiersz A B
A 1 -2
B -1 0
C -4 5

Przeanalizujmy teraz, jak wygląda nasza przykładowa gra 2.1 z punktu widzenia opłacalności poszczególnych wyborów graczy. Jeśli Wiersz wybierze opcję A to kolumnie opłaca się wtedy wybrać B, gdyż dla opcji A Kolumna przegrywa \(1\) a w opcji B Kolumna wygrywa \(2\). Na diagramie przesunięć poniżej oznaczono ten fakt przy pomocy strzałki w prawo w polu (A,A). Zauważmy, że strzałka ta jest skierowana od wartości większej \((1)\) do mniejszej \((-2)\) zgodnie z konwencją, że wygrane Kolumny są liczbami przeciwnymi do wygranych wiersza. A zatem ta strzałka, tak naprawdę wskazuje preferencje Kolumny: zakładając, że Wiersz pozostanie przy opcji A, wybór B Kolumny jest dla niej korzystniejszy niż A \((2 > -1)\). Można podsumować, że poziome strzałki diagramu przesunięć są zawsze skierowane od wartości większych do mniejszych oraz wskazują preferowane opcje Kolumny.

Diagram przesunięć
Macierzy pokazująca dla każdej pary wyborów preferencje graczy
2.1 Kolumna
Wiersz A B
A \(\rightarrow\) \(\downarrow\)
B \(\uparrow\) \(\leftarrow \; \downarrow\)
C \(\uparrow\) \(\leftarrow\)

Preferowane opcje Wiersza wskazują strzałki pionowe, które są zawsze skierowane od wartości mniejszych do większych, zgodnie z preferencjami Wiersza. Strzałka skierowana w dół w polu (B,B) oznacza, że przy zadanym wyborze B Kolumny, opcja C jest dla Wiersza korzystniejsza niż B. Zauważmy, że w polu (B,B) znajduje się również strzałka skierowana w lewo. Oznacza ona, że przy zadanym wyborze B Wiersza, opcja A jest dla Kolumny korzystniejsza niż B. W każdym polu diagramu przesunięć gry 2.1 znajduje się jakaś strzałka. Oznacza to, że nie ma w tej grze pary wyborów, która byłaby korzystna dla oby graczy: dla każdej pary wyborów jeden z graczy może znaleźć opcję korzystniejszą, przy założeniu, że partner pozostanie przy swojej. Ta sytuacja jednak nie zawsze ma miejsce, zobaczmy bowiem kolejną grę:

Przykład 2.2 Gra z punktem równowagi.
Macierz wypłat 2.2
2.2 Kolumna
Wiersz A B C
A -1 3 1
B 0 2 0

Diagram przesunięć dla tej gry wygląda następująco:

Diagram przesunięć dla gry 2.2
2.2 Kolumna
Wiersz A B C
A \(\downarrow\) \(\leftarrow \; \; \; \; \rightarrow\)
B \(\leftarrow \; \uparrow \; \rightarrow\) \(\uparrow\)

Jak widzimy w polach (B,A) i (A,C) nie ma żadnych strzałek. Oznacza to, że jeśli gracze znajdą się w jednym z tych punktów, to żadnemu z nich nie opłaca się jednostronnie zmieniać swojej opcji na sąsiednią. Takie miejsca nazywamy lokalnymi punktami równowagi. Zauważmy, że punkty równowagi jest określony lokalnie, poprzez wartości wypłat pól sąsiednich. Jaką strategię powinni obrać graczy w tej grze? Dla Wiersza korzystniejszą jest równowaga (A,C) - wygrana \(1\) niż (B,A) - wygrana \(0\). Załóżmy więc, że wybierze on opcję A. Wtedy jednak Kolumna szybko zauważy, że lepiej jej jest nie grać swojej opcji C dla równowagi (A,C) gdyż opcja A jest dla nie korzystniejsza. Jeśli Wiersz to zauważy to sam powinien zagrać B, co doprowadzi graczy do drugiej równowagi (B,A). Po osiągnięciu tej równowagi, żaden z graczy nie jest zainteresowany zmianą swojej strategii: wygrana \(0\) jest bowiem dla wiersza najwyższa w kolumnie A, natomiast dla Kolumny jest ona nie mniej korzystna niż inne w wierszu B. Żaden z graczy nie może wygrać więcej przez jednostonną zmianę swojej strategii.

Punkty siodłowe oraz dominacje

Rozpoczniemy od definicji punktu siodłowego

Punkt siodłowy
Punkt macierzy wypłat, którego wartość jest nie większa od innych wartości w jego wierszu oraz nie mniejsza od innych wartości w jego kolumnie nazywamy punktem siodłowym. Na punkt siodłowy składa się para zawierających go strategii oraz odpowiadająca im wygrana \( \nu \), którą nazywamy wartością gry.

W grze 2.2 punktem siodłowym jest równowaga (B,A). Wiersz grając należącą do punktu siodłowego strategię B może być pewien, że nie wygra mniej niż wynosi wartość gry \(0\) a Kolumna grając należącą do punktu siodłowego strategię A ma pewność, że Wiersz nie wygra więcej niż wynosi wartość gry.

Zauważmy, że niezależnie od strategii Wiersza, Kolumna może z góry wykluczyć swoją strategię B. Istotnie, Strategia B jest zawsze gorsza od strategii A i strategii C Kolumny. Obrazują to poziome strzałki na diagramie przesunięć gry 2.2. Ten przypadek ilustruje ważne pojęcie strategii zdominowanej.

Strategia zdominowana
Mówimy, że strategia X gracza jest zdominowana przez strategię Y tego gracza jeżeli X i Y nie są identyczne a niezależnie od strategii przeciwnika wypłata przy wyborze X jest niewiększa od wypłaty przy wyborze Y. W tym przypadku mówimy również, że strategia Y gracza dominuje strategię X.

Jak widzimy na przykładzie 2.2 strategia B Kolumny jest zdominowana przez strategię A oraz przez strategię C. Istotnie dla wypłaty Kolumny porównując B z A mamy \(-3<1\) i \(-2<0\). Podobnie rzecz się ma przy porównaniu B z C. Jeśli jakaś strategia jest zdominowana przez inną to gracz może tej strategii nie brać pod uwagę w rozgrywce. Rzeczywiście zamiast tej strategii może zawsze wybrać inną, która ją dominuje a jego wygrana będzie co najmniej równa wygranej dla strategii zdominowanej.

Załóżmy, że mamy do czynienia z racjonalnymi graczami, którzy nie wybierają strategii dla siebie niekorzystnych. W tym przypadku analizując grę możemy ją uprościć usuwając z niej wszystkie strategie zdominowane. W przypadku gry 2.2 możemy spokojnie usunąć strategię B Kolumny. W tym przypadku gra przybierze postać


Przykład 2.2' Gra 2.2 bez strategii zdominowanej.
Macierz wypłat 2.2'
2.2' Kolumna
Wiersz A C
A -1 1
B 0 0

Na diagramie przesunięć dla tej gry znajdziemy jeden punkt równowagi (B,A):

Diagram przesunięć dla gry 2.2'
2.2 Kolumna
Wiersz A C
A \(\downarrow\) \(\leftarrow\)
B \( \uparrow\)

Zauważmy, że punkt równowagi (B,A) jest jednocześnie punktem siodłowym. Wyeliminowanie z gry strategii zdominowanej uprościło jej analizę i z dwu punktów równowagi pozostał tylko jeden - ten który jest jednocześnie punktem siodłowym. Przeanalizujmy teraz bardziej złożoną grę, w której każdy z graczy ma po 4 opcje wyboru.

Przykład 2.3 Gra z kilkoma punktami siodłowymi.
Macierz wypłat 2.3
2.3 Kolumna
Wiersz A B C D
A 2 1 3 1
B -1 0 7 -5
C 9 1 5 1
D 1 0 7 -2

Diagram przesunięć dla tej gry wygląda następująco:

Diagram przesunięć dla gry 2.3
2.3 Kolumna
Wiersz A B C D
A \(\rightarrow\) \(\leftarrow \; \downarrow \; \rightarrow\)
B \(\updownarrow\) \(\leftarrow \; \updownarrow\) \(\leftarrow \; \; \; \; \rightarrow\) \(\updownarrow\)
C \(\rightarrow\) \(\leftarrow \; \updownarrow \; \rightarrow\)
D \(\uparrow \; \rightarrow\) \(\uparrow\) \(\leftarrow \; \; \; \; \rightarrow\) \(\uparrow\)

W tej grze można wyeliminować strategię C Kolumny, jest ona zdominowana zarówno przez strategię B jak i D a zatem racjonalny gracz nie powinien jej wybierać. Wiedząc o tym, Wiersz powinien więc planować swoje wybory uwzględniając, że Kolumna nie zagra strategii C. Po wyeliminowaniu jej uzyskamy grę:


Przykład 2.3' Gra z kilkoma punktami siodłowymi.
Macierz wypłat 2.3'
2.3 Kolumna
Wiersz A B D
A 2 1 1
B -1 0 -5
C 9 1 1
D 1 0 -2

dla której diagram przesunięć jest

Diagram przesunięć dla gry 2.3'
2.3' Kolumna
Wiersz A B D
A \(\rightarrow\)
B \(\updownarrow\) \(\leftarrow \; \updownarrow \; \rightarrow\) \(\updownarrow\)
C \(\rightarrow\)
D \(\uparrow \; \rightarrow\) \(\uparrow \; \rightarrow\) \(\uparrow\)

Zauważmy, że w zmodyfikowanej grze 2.3' strategie B i D Wiersza również są zdominowane na przykład przez strategię C. Dla Wiersza oznacza to, że może tych strategii nie brać pod uwagę, co dodatkowo znacznie uprości grę do postaci


Przykład 2.3\(''\) Gra z kilkoma punktami siodłowymi.
Macierz wypłat 2.3\(''\)
2.3\(''\) Kolumna
Wiersz A B D
A 2 1 1
C 9 1 1

dla której diagram przesunięć jest

Diagram przesunięć dla gry 2.3\(''\)
2.3\(''\) Kolumna
Wiersz A B D
A \(\rightarrow\)
C \(\rightarrow\)

.

A teraz już tylko jeden krok do rozwiązania gry, które otrzymamy po wyeliminowaniu zdominowanej strategii A Kolumny (zauważmy, że Kolumna nie mogła wyeliminować swojej strategii A już w pierwszym kroku, gdyż w pierwotnej postaci gry 2.3 ta strategia nie jest zdominowana). Po tej trzystopniowej redukcji strategii zdominowanych gra 2.3 sprowadza się do prostej formy

Przykład 2.3\('''\) Gra z kilkoma punktami siodłowymi.
Macierz wypłat 2.3\('''\)
2.3\('''\) Kolumna
Wiersz B D
A 1 1
C 1 1

dla której diagram przesunięć jest oczywiście pusty. Rozwiązanie gry 2.3 mówi nam, że Wiersz powinien grać strategię A lub C a Kolumna strategię B lub D. Grając te strategie obaj gracze mają gwarancję, że ich wynik będzie nie gorszy niż wynosi wartość gry, którą jest w tym przypadku \( \nu=1 \). Zauważmy, że pary strategii (A,B), (A,D), (C,B) i (C,D) są punktami siodłowymi gry w każdej jej postać od 2.3 do 2.3\('''\). W pierwotnej postaci gry para strategii (D,A) również dawała wygraną równą wartości gry \( \nu=1 \) ale para ta nie jest punktem siodłowym. Istotnie, gdyby na przykład wiersz zdecydował się zagrać strategię D to Kolumna mogłaby zagrać również D uzyskując dla siebie wynik \(2\) dużo korzystniejszy niż wartość gry.

Rozwiązanie gry
Rozwiązaniem gry o sumie zerowej nazywamy parę strategii optymalnych oraz wartość gry \(\nu\,\) czyli wypłatę, odpowiadającą tym strategiom. Strategia gracza jest optymalna, jeżeli jego wygrana będzie równa co najmniej \(\nu\,\), niezależnie od strategii przyjętej przez drugiego gracza.

Zauważmy, że każdy punkt siodłowy jest rozwiązaniem gry. Gra 2.3 ma zatem 4 rozwiązania, odpowiadające wartości gry \( \nu=1\,\). Czy możliwa jest sytuacja w której gra ma kilka punktów siodłowych odpowiadających różnym wartościom wygranej? Gdyby tak było, to nie można by jednoznacznie określić wartości gry. Na szczęście taka sytuacja nie może mieć miejsca. Zachodzi bowiem twierdzenie

Twierdzenie. Każde dwa punkty siodłowe tej samej gry odpowiadają tej samej wypłacie.
Dowód
załóżmy, że para strategii (X\(_{1}\),Y\(_{1}\)) odpowiada wypłacie \( \nu_{1,1}\,\) a para strategii (X\(_{2}\),Y\(_{2}\)) odpowiada wypłacie \( \nu_{2,2}\,\) oraz (X\(_{1}\),Y\(_{1}\)) i (X\(_{2}\),Y\(_{2}\)) są punktami siodłowymi. Pokażemy, że \( \nu_{1,1}=\nu_{2,2}\,\). Gdyby X\(_{1}\) = X\(_{2}\) to \( \nu_{1,1}=\nu_{2,2}\,\) gdyż z definicji żaden z dwu punktów siodłowych w jednym wierszu nie może być większy od drugiego. Podobnie pokazujemy tezę dla Y\(_{1}\) = Y\(_{2}\). Możemy więc założyć, że strategie X\(_{1}\) i X\(_{2}\) są różne podobnie jak Y\(_{1}\) i Y\(_{2}\). Rozważmy dodatkowe pary strategii (X\(_{1}\),Y\(_{2}\)) i (X\(_{2}\),Y\(_{1}\)), oraz odpowiadające im wypłaty \( \nu_{1,2}\,\) i \( \nu_{2,1}\,\) (por. tabela 2.4). Zauważmy, że z definicji punktu siodłowego wynika, że wszystkie wartości w wierszu są nie mniejsze od \( \nu_{1,1} \,\) i \( \nu_{2,2}\,\) więc
Tabela 2.4
2.4 Kolumna
Wiersz ... Y\(_{1}\) ... Y\(_{2}\) ...
... ... ... ... ... ...
X\(_{1}\) ... \(\nu_{1,1}\) ... \(\nu_{1,2}\) ...
... ... ... ... ... ...
X\(_{2}\) ... \(\nu_{2,1}\) ... \(\nu_{2,2}\) ...
... ... ... ... ... ...

\[ \nu_{1,1} \leqslant \nu_{1,2} \] oraz \( \nu_{2,2} \leqslant \nu_{2,1} \).

Podobnie z definicji punktu siodłowego wynika, że wszystkie wartości w kolumnie są nie większe od \( \nu_{1,1}\) i \( \nu_{2,2}\) więc

\[ \nu_{2,1}\leqslant\nu_{1,1} \] oraz \( \nu_{1,2} \leqslant \nu_{2,2} \).

Z nierówności tych wynika bezpośrednio, że

\[ \nu_{1,1}=\nu_{1,2}=\nu_{2,2}=\nu_{2,1} \;\]

A zatem udowodniliśmy twierdzenie pokazując ponadto dodatkowe dwa punkty siodłowe, które wraz z pierwotnie wybranymi tworzą prostokąt w tabeli wypłat.

Maksimin i minimaks

Poszukiwanie punktów siodłowych metodą redukcji strategii zdominowanych tak jak to pokazaliśmy w przykładzie 2.3 jest możliwe tylko dla niektórych gier. W ogólnym przypadku taka metoda jest nieskuteczna. W tym rozdziale zajmiemy się ogólną metodą poszukiwania punktów siodłowych za pomocą wyznaczania maksiminu i minimaksu. Aby to zrobić odwołamy się do przekładu gry 2.5. Jak widać z przedstawionej poniżej tabeli wypłat żaden a wierszy ani żadna z kolumn 2.5 nie jest zdominowana przez inne.

Przykład 2.5 Wyznaczanie punktów siodłowych metodą maksiminu i minimaksu.
Maksimin jest maksymalną spośród wypłat minimalnych w wierszach a minimaks jest minimalną spośród wypłat maksymalnych w kolumnach macierzy
2.5 Kolumna minima
wierszy
maksimin
Wiersz A B C D
A -1 0 5 0 -1
B 2 1 3 2 1 1
C 1 0 4 -2 -2
D 3 1 0 1 0
maksima kolumn 3 1 5 2
minimaks 1

Z definicji punkt siodłowy ta taki, którego wartość jest nie większa on innych w jego wierszu. Poszukajmy zatem najmniejszych wartości w każdym wierszu. W przykładzie 2.5 pokazano je jako "minima wierszy", jeśli gra miałaby punkt siodłowy to musiałby on znaleźć się na tej liście. Z drugiej jednak strony punkt siodłowy to taki, którego wartość jest nie mniejsza od innych w jego kolumnie. Poszukajmy więc największych wartości w poszczególnych kolumnach. W tabeli 2.5 pokazano je jako "maksima kolumn". Teraz jest jasne, że aby gra miała punkt siodłowy, musi on należeć do obu tych list. Ale maksima kolumn są nie mniejsze niż minima wierszy dlatego jedyną możliwością znalezienia części wspólnej obu tych list jest porównanie minimalnego maksimum kolumn i maksymalnego minimum wierszy. Jeśli te dwie liczby są równe to ich wspólna wartość jest punktem siodłowym oraz wartością gry \( \nu \). Minimalne maksimum kolumn nazywamy minimaksem a maksymalne minimum wierszy nazywamy maksiminem. Udowodniliśmy zatem twierdzenie

Twierdzenie o maksiminie i minimaksie
Jeśli maksimin i minimaks gry macierzowej są równe to gra posiada punkt lub punkty siodłowe o tej wartości. Punkty te leżą na przecięciu wierszy i kolumn których minima i maksima są równe tej wartości. Jeśli maksimin jest mniejszy od minimaksu to gra nie posiada punktów siodłowych.

Jak widać w przypadku gry 2.5 ma ona dwa punkty siodłowe (A,B) i (A,D) o wartości wspólnej maksiminu i minimaksu \( \nu=1 \). Inne pary strategii o wartości 1, t.j (C,B), (C,D) i (A,E) nie są punktami siodłowymi gdyż nie leżą na przecięciu wierszy i kolumn których zarówno minima jak i maksima są równe 1.

Strategie mieszane

W poprzednim rozdziale pokazaliśmy, że poszukiwanie punktów siodłowych jest wygodnym sposobem poszukiwania rozwiązań gier o sumie zerowej. Zauważyliśmy również, że aby gra miała punkt siodłowy musi zachodzić równość minimaksu i maksiminu dla tabeli tej gry. Powróćmy jeszcze raz do pierwszego rozważanego przykładu 2.1. Jak widzimy dla tej gry taka równość nie zachodzi bo maksimin=1 a minimaks=-1.

Przykład 2.6 Gra bez punktów siodłowych.
W tej grze maksimin=1 a minimaks=-1 więc nie ma punktu siodłowego
2.6 Kolumna minima
wierszy
maksimin
Wiersz A B
A 1 -2 -2
B -1 0 -1 -1
C -4 5 -4
maksima kolumn 1 5
minimaks 1

Na diagramie przesunięć gry 2.1 nie ma żadnego punktu równowagi. Oznacza to, że nie istnieje taka para opcji dla Wiersza i Kolumny która, gdyby była wybrana, zapewniłaby im wygraną równą wartości gry. Wszak taka para musiałaby być równowagą, której w naszej grze brak. Czyżby zatem gra 2.1 nie miała rozwiązania? Okazuje się, że takie rozwiązanie istnieje, tyle, że oparte jest o tzw. strategie mieszane.

Strategia mieszana
Strategią mieszaną nazywamy taki sposób gry w którym gracz Wiersz wybiera dostępne opcje A, B, C,... w sposób losowy w prawdopodobieństwem \(pW_X >0\,\) oraz \(\sum\limits_{X=A,B,\ldots} pW_X = 1\,\) . Taką strategię oznaczamy symbolem \([pW_A, pW_B, pW_C...]_W \,\). Analogicznie definiujemy strategię mieszaną Kolumny

A zatem strategia mieszana jest sposobem na gry, które są rozgrywane wielokrotnie - dopiero wtedy nabiera znaczenia to, że poszczególnym opcjom gracza odpowiada prawdopodobieństwo ich wybrania. Strategią mieszaną będzie na przykład użycie przez Wiersz monety do losowania jednej z dwu opcji A i B. W tym przypadku odpowiednie prawdopodobieństwa powinny wynosić \(pW_A=pW_B=1/2\,\). Przy stosowaniu strategii mieszanej wygraną gracza da się określić tylko jako jej wartość oczekiwana.

Wartość oczekiwana wypłaty
Jeżeli prawdopodobieństwa uzyskania wypłat \(a_1, a_2,...a_k \,\) wynoszą odpowiednio \(p_1, p_2,...p_k, (p_1 + p_2+...+ p_k=1 \,\)) to wartością oczekiwaną wypłaty \(\mathbb E\,\) jest

\[\mathbb E =a_1 p_1 + a_2 p_2 +...+ a_k p_k\,\]

Przykład
Jeśli w grze 2.6 Kolumna zagra opcję A z prawdopodobieństwem \(pK_A=1/2\,\) i B z prawdopodobieństwem \(pK_B=1/2\,\) czyli wybierze strategię \([1/2, 1/2]_K\,\) to wartość oczekiwana wypłaty Wiersza przy wyborze opcji A, którą oznaczamy \(\mathbb EW_A\,\), wynosi

\[\mathbb EW_A=\frac {1}{2} \cdot 1 + \frac {1}{2} \cdot(-2) = -\frac {1}{2}\],

podobnie wartość oczekiwana wypłaty Wiersza przy wyborze opcji B (\(\mathbb EW_B\,\)) wynosi

\[\mathbb EW_B=\frac {1}{2}\cdot (-1) + \frac {1}{2} \cdot 0 = -\frac {1}{2}\].

Zauważmy, że granie według strategii mieszanej jest jakościowo różne od strategii prostej. W przypadku tej pierwszej nie mamy jednoznacznej recepty którą opcję należy przy danym wyborze wybrać, wiemy tylko z jakim prawdopodobieństwem mamy ją wybrać. Sytuacja nieco przypomina opis świata fizycznego przy pomocy mechaniki klasycznej i kwantowej. W tej pierwszej, mamy dokładną informację co do "parametrów gry": położeń, prędkości poszczególnych cząstek. W mechanice kwantowej wiemy jedynie, lub obserwujemy, jakie są prawdopodobieństwa przyjęcia poszczególnych wartości przez te "parametry". W tym miejscu nie będziemy bardziej rozwijać tej analogii, zainteresowanych odsyłam do prac Sładkowskiego i Piotrowskiego.

Osobnym tematem pozostaje sposób realizacji strategii mieszanej. Sprawę wyjaśnijmy na przykładzie. Gdyby Kolumna mając do wyboru dwie opcje A i B jak w przykładzie 2.6 miała zagrać strategią \([2/3, 1/3]_K\,\) to jak ją zrealizuje? Można by przypuszczać, że powinna grać B w co trzeciej grze, tzn. wybierając A,A,B,A,A,B,... , gdyż w ten sposób zrealizowałaby żądany rozkład prawdopodobieństwa. Przypuszczamy jednak, że Wiersz, gdyby to zauważył natychmiast wykorzystałaby tą wiedzę i dopasował swoją strategię grając sekwencję: A,A,C,A,A,C,... w której jego wypłata po każdej sekwencji trzech wyborów wynosiłaby 7. Byłby to najgorszy z możliwych scenariuszy dla Kolumny. Aby zagrać strategią \([2/3, 1/3]_K\,\) Kolumna powinna to zrobić w sposób losowy. Można w tym celu wykorzystać np rzut kostką i wybierać B tylko gdy wypadnie "5" lub "6", losować "z kapelusza", można w losowy sposób otwierać kartki książki i wybierać "B" gdy numer strony jest podzielny przez 3, spoglądać na sekundnik zegarka i stosować tę samą zasadę dla zaobserwowanej akurat sekundy. (Lepiej jednak spojrzenie na zegarek ukryć przed Wierszem bo może odgadnąć zasadę i wykorzystać swój zegarek.) Można wykorzystać jakikolwiek inny ""generator"" losowy.

Rozwiązania gier w strategiach mieszanych

Poszukamy teraz metody znajdywania rozwiązań gier, które nie mają punktów siodłowych przy pomocy strategii mieszanych. Rozważmy następującą grę bez punktów siodłowych

Przykład 2.7 Gra bez rozwiązań w strategiach prostych
W tej grze maksimin=0 a minimaks=1 więc nie ma punktu siodłowego
2.7 Kolumna minima
wierszy
maksimin
Wiersz A B
A 2 -3 -3
B 0 1 0 0
maksima kolumn 2 1
minimaks 1

Załóżmy że Kolumna w tej grze gra strategią \([pK_A, pK_B]_K\,\). Wówczas wartość oczekiwana wygranych Wiersza będzie:

(1)\(\mathbb EW_A=pK_A \cdot 2 + (1-pK_A)\cdot(-3) = -3 + 5 pK_A\,\), \[\mathbb EW_B=pK_A \cdot 0 + (1-pK_A)\cdot 1 = 1 - pK_A\,\],

Zauważmy, że jeżeli zechcemy aby \(\mathbb EW_A=\mathbb EW_B\,\), tzn.

\[-3 + 5 pK_A = 1 - pK_A\,\],

to wyliczona stąd wartość \(pK_A=2/3\,\) wyznacza strategię Kolumny \([2/3, 1/3]_K\,\) taką, dla której wartość oczekiwana wypłaty Wiersza nie będą zależały od wybranej przezeń opcji. Taką strategię nazywamy strategią wyrównującą Kolumny. Jeśli Kolumna ją zastosuje to ta wartość oczekiwana będzie równa \[\mathbb EW_A=\mathbb EW_B=1/3,\,\] niezależnie od zastosowanej przez Wiersz strategii. Ale Wiersz również ma swoją strategię wyrównującą, którą obliczymy zakładając, że \(\mathbb EK_A=\mathbb EK_B\,\), gdzie

\[\mathbb EK_A=pW_A\cdot 2 + (1-pW_A)\cdot 0 = 2pW_A,\,\] \[\mathbb EW_B=pW_A\cdot(-3) + (1-pW_A)\cdot1 = 1 - 4pW_A,\,\]

czyli \(pW_A=1/6\,\), co daję strategię wyrównującą Wiersza \([1/6, 5/6]_W\,\). Wartość oczekiwana wygranej Kolumny przy tej strategii jest taka sama \(\mathbb EK_A=\mathbb EK_B=1/3\,\).

Można więc powiedzieć, że strategie wyrównujące dają nam parę strategii optymalnych dla obu graczy \([2/3, 1/3]_K, [1/6, 5/6]_W\,\) oraz wartość gry wyrażoną jako wartość oczekiwaną wygranej obu graczy \(\nu=1/3\,\) czyli rozwiązanie gry 2.7 wyrażone w strategiach mieszanych.

Na uzyskane rozwiązanie składają się dwie strategie optymalne obu gracz, jeśli wiersz zastosuje swoją strategię \([1/6, 5/6]_W\,\) to niezależnie od tego, jak będzie grała Kolumna to wartość oczekiwana jej wypłaty będzie równa \(\nu=-1/3\,\). Podobnie jeśli Kolumna zagra swoją strategię optymalną \([2/3, 1/3]_K\,\) to niezależnie od tego co zrobi Wiersz, jego wartość oczekiwana wypłaty będzie równa \(\nu=-1/3\,\). Sytuacja odzwierciedla parę strategii punktu siodłowego z tą różnicą, że wygrane zostały zastąpione ich wartościami oczekiwanymi. To jest jednak nieuniknione jeśli mówimy o strategiach mieszanych.

Warunki istnienia punktów siodłowych

Gra posiadająca punkty siodłowe ma swoje rozwiązania w strategiach prostych. Czy można podać ogólną receptę na rozwiązania gry, która tak jak gra 2.8 nie posiada punktów siodłowych? Okazuje się że odpowiedź na to pytanie jest pozytywna. Zanim jednak podamy ogólna rozwiązania skupimy się na najprostszym przypadku gry typu (2x2) (po dwie dostępne opcje dla Wiersza i Kolumny) i jej macierzy wypłat kiedy nie ma ona punktów siodłowych. Ogólną grę można zapisać w postaci macierzy wypłat \(\mathcal{W}=\{w_{X,Y}\}\,\)

Przykład 2.8 Ogólna gra typy (2x2)
Gra (2x2) opisana przy pomocy macierzy wypłat \(\mathcal{W}=\{w_{X,Y}\}\,\)
2.8 Kolumna
Wiersz A B
A \(w_{A,A}\,\) \(w_{A,B\,}\)
B \(w_{B,A}\,\) \(w_{B,B}\,\)
Twierdzenie 2.8
Gra typu 2.8 nie ma punktów siodłowych wtedy i tylko wtedy gdy
(2)\( \begin{array}c rK_B \cdot rK_A <0\,\\ rW_B \cdot rW_A <0\, \end{array} \)
oraz
(3)\( \begin{array}c rK_A \cdot rW_A >0\,\\ rK_B \cdot rW_B >0\, \end{array} \)
gdzie:

\[rK_A=w_{A,A}-w_{B,A}\,\] \[rK_B=w_{A,B}-w_{B,B}\,\] \[rW_A=w_{A,A}-w_{A,B}\,\] \[rW_B=w_{B,A}-w_{B,B}\,\]

Dowód: Zauważmy, że pierwsze dwie nierówności (2) oznaczają, że powyższa gra nie ma strategii zdominowanych. Pierwsza z nich oznacza, że żaden z wierszy 2.8 nie jest zdominowany - rzeczywiście znaki \(rK_A\,\) oraz \(rK_B\,\) wyznaczają kierunki pionowych strzałek diagramu przesunięć a ujemny znak ich iloczynu świadczy, że są skierowane przeciwnie. Drugi warunek (2) oznacza, że poziome strzałki, których kierunki wyznaczają \(rW_A\,\) i \(rW_B\,\) są skierowane przeciwnie.
Jeśli, jak w tych dwu pierwszych nierównościach, iloczyn dwu czynników jest ujemny, to czynniki te muszą być liczbami niezerowymi o przeciwnych znakach, można to osiągnąć na cztery sposoby: \((+-)\), \((+-)\) lub \((+-)\), \((-+)\) lub \((-+)\), \((-+)\) lub \((-+)\), \((+-)\). Odpowiada to czterem postaciom diagramu przesunięć:
Diagramy przesunięć 2.8
postać 1
\(\downarrow\) \(\leftarrow\)
\(\rightarrow\) \(\uparrow\)
postać 2
\(\downarrow \rightarrow\)
\(\leftarrow \uparrow\)
postać 3
\(\rightarrow\) \(\downarrow\)
\(\uparrow\) \(\leftarrow\)
postać 4
\(\leftarrow \downarrow\)
\(\uparrow \rightarrow\)
Zwróćmy jednak uwagę, że diagram przesunięć w postaci 2 jest niemożliwy gdyż prowadzi do zestawu sprzecznych nierówności \(w_{A,A} < w_{B,A} < w_{B,B} < w_{A,B} < w_{A,A} \,\). Podobnie nie istnieje macierz odpowiadająca diagramowi w postaci 4. Oznacza to jednak, że z czterech możliwych wariantów znakozmienności powyższych wyrażeń pozostają tylko dwa odpowiadające postaciom 1 i 3 diagramu przesunięć: \((+-)\), \((+-)\) lub \((-+)\), \((-+)\) a to prowadzi do kolejnych dwu nierówności (3) naszego twierdzenia. Pokazaliśmy zatem że spełnienie wszystkich czterech nierówności jest równoważne, że diagramy przesunięć przybierają postać 1 lub 3 a to jest równoważne temu, że gra nie ma punktów siodłowych.

Ogólna metoda rozwiązania gier (2x2) w strategiach mieszanych

Wiedząc jakie warunki spełnia macierz wypłat \(\mathcal{W}=\{w_{X,Y}\}\,\) gry (2x2) która nie ma punktów siodłowych podamy teraz jej rozwiązania w strategiach mieszanych. Układ równań równań (1), który zapisaliśmy w przykładzie 2.7 można zapisać w postaci ogólnej jako

(4)\( \begin{bmatrix} w_{A,A} & w_{A,B} \\ w_{B,A} & w_{B,B}\end{bmatrix} \begin{bmatrix} pK_{A} \\ 1-pK_{A}\end{bmatrix}= \begin{bmatrix} \mathbb EW_A \\ \mathbb EW_B\end{bmatrix} \),

ale \(\mathbb EW_A = \mathbb EW_B \,\) więc rozwiązując układ równań (4) dostaniemy wzory na strategię wyrównującą Kolumny

(5)\( pK_A= \frac{rK_B}{rK_B - rK_A},\,\,\,\,\,pK_B = 1 - pK_A = \frac{-rK_A}{rK_B - rK_A}\)

oraz

(6)\( \mathbb EW_A=\mathbb EW_B=w_{B,B} + \frac{rW_B \cdot rK_B}{rW_B - rW_A}\).

W analogiczny sposób wyznaczamy strategię wyrównującą wiersza, która wyraża się symetrycznymi wzorami w których jednak macierz \(\mathcal{W}\,\) zastąpiono jej macierzą transponowaną \(\mathcal{W}^{T}=\{w_{Y,X}\}\) a w związku z tym w równaniach (5) i (6) należy dokonać zamiany wiersza na kolumnę i odwrotnie:

(7)\( pW_A= \frac{rW_B}{rW_B - rW_A},\,\,\,\,\,pW_B = 1 - pW_A = \frac{-rW_A}{rW_B - rW_A}\)

wartość oczekiwana wygranej Kolumny ma taką samą wartość, jak wygrana Wiersza, tu przedstawiamy jej równoważną, wynikającą z symetrii postać

(8)\( \mathbb EK_A=\mathbb EK_B=w_{B,B} + \frac{rK_B \cdot rW_B}{rK_B - rK_A}\).

Zauważmy, że z twierdzenia 2.8 wynika, że dla gier, które nie mają punktów siodłowych wszystkie różnice \(rK_A\,\), \(rK_B\,\), \(rW_A\,\) i \(rW_B\,\) w licznikach i mianownikach wyrażeń na (5) i (7) są jednocześnie tego samego znaku - dodatnie lub ujemne. Jest to ważne ponieważ oznacza, że są spełnione warunki \( 0 < pK_A < 1\,\) i \( 0 < pW_A < 1\,\) niezbędne aby \( pK_A \,\) i \( pK_B \,\) oraz \( pW_A \,\) i \( pW_B \,\) były odpowiednimi prawdopodobieństwami. W związki z tym wzory te można przedstawić w równoważnej postaci:

(9)\( pK_A= \frac{|rK_B|}{|rK_B| + |rK_A|},\,\,\,\,\,pK_B = \frac{|rK_A|}{|rK_B| + |rK_A|}\)

oraz

(10)\( pW_A= \frac{|rW_B|}{|rW_B| + |rW_A|},\,\,\,\,\,pW_B = \frac{|rW_A|}{|rW_B| + |rW_A|}\)


W związku z powyższymi wzorami można wskazać praktyczną metodę wyznaczania strategii mieszanych dla gier (2x2) bez punktu siodłowego.

Przykład 2.9 Metoda Williamsa
Graficzna metoda obliczania mieszanych strategii optymalnych Wiersza i Kolumny oraz wartości gry dla gier (2x2) bez punktu siodłowego.
2.9 Kolumna różnice
w wierszach
\( pW_A \,\) i \( pW_B \,\) dla strategii optymalnej Wiersza
Wiersz A B
A \(w_{A,A}\,\) \(w_{A,B}\,\) \(rW_A \,\) \(\frac{|rW_B|}{|rW_B| + |rW_A|}\)
B \(w_{B,A}\,\) \(w_{B,B}\,\) \(rW_B\,\) \(\frac{|rW_A|}{|rW_B| + |rW_A|}\)
różnice w kolumnach \(rK_A\,\) \(rK_B\,\) \( \mathbb EW=\mathbb EK=w_{B,B} + \frac{|rW_B| \cdot |rK_B|}{|rW_B| + |rW_A|}\)
\( pK_A \,\) i \( pK_B \,\) dla strategii optymalnej Kolumny \(\frac{|rK_B|}{|rK_B| + |rK_A|}\) \(\frac{|rK_A|}{|rK_B| + |rK_A|}\)

Rozwiązania gier typu (mx2) i (2xn)

Jak pokazaliśmy w poprzednich rozdziałach istnieją rozwiązania dowolnych gier o sumie zerowej o wymiarze (2x2). O grach dla których gracze mają więcej niż dwie opcje do wyboru, t.j. np. (mxn), gdzie przynajmniej jedna z tych liczb jest większa od dwójki wiemy tyle, że uda się nam je rozwiązać jeżeli mają punkty siodłowe. Metodę poszukiwania takich punktów opisaliśmy w rozdziale Maksimin i minimaks. Jeśli gra nie posiada takich punktów to można próbować zredukować jej wymiar poprzez poszukiwanie strategii zdominowanych. Jak zobaczyliśmy w rozdziale Punkty siodłowe oraz dominacje redukcja taka może się wieloetapowa, poprzez kolejne eliminowanie zdominowanych wierszy i kolumn. Końcowym etapem redukcji gry 2.3 była gra (2x2) posiadająca punkty siodłowe. Co jednak jeśli omawiane wyżej kroki nie doprowadzą do rozwiązania gry? Obecny rozdział poświęcimy takim przypadkom, w których nieredukowalne i nie posiadające punktów siodłowych gry mają wymiar (mx2) lub (2xn). Rozważmy na przykład grę typu (2x4), która nie posiada punktów siodłowych ani strategii zdominowanych. Załóżmy, że Kolumna gra strategią mieszaną \([pK_A, pK_B, pK_C, pK_D] \,\). Zwróćmy uwagę, że taką strategia mieszana można zapisać jako wektor

(11)\( \begin{bmatrix} w_{A,A} & w_{A,B} & w_{A,C} & w_{A,D} \\ w_{B,A} & w_{B,B} & w_{B,C} & w_{B,D}\end{bmatrix} \begin{bmatrix} pK_{A} \\ pK_{B} \\ pK_{C} \\pK_{D} \end{bmatrix}= \begin{bmatrix} \mathbb EW_A \\ \mathbb EW_B\end{bmatrix} \),


w dwuwymiarowej przestrzeni wartości oczekiwanych wygranej Wiersza odpowiadających wyborom opcji A i B. Wszystkie strategie mieszane Kolumny tworzą tzw. otoczkę wypukłą rozpiętą na wektorach będących kolumnami macierzy wypłat. Żeby nasze rozważania były jaśniejsze zilustrujemy to przykładem konkretnej gry (2x4) (zobacz rysunek 2)

Przykład 2.10 Rozwiązanie gry typu (2x4)
Gra (2x4) bez punktów siodłowych i strategii zdominowanych
2.1 Kolumna
Wiersz A B C D
A -4 0 2 3
B 2 1 0 -3

Rys. 2. Rys1swm.png

Na rysunku przedstawiono cztery punkty odpowiadające strategiom czystym A, B, C i D Kolumny. Tym strategiom odpowiadają wektory wygranych

\[ \begin{bmatrix} -4 \\ 2\end{bmatrix},\;\; \begin{bmatrix} 0\\ 1\end{bmatrix},\;\; \begin{bmatrix} 2\\ 0\end{bmatrix},\;\; \begin{bmatrix} 3\\ -3\end{bmatrix}. \]

Każda strategia mieszana jest, jak wynika z (11), wyznaczona przez kombinację liniową tych wektorów o współczynnikach nieujemnych sumujących się do jedności. Takie kombinacje tworzą otoczkę liniową zilustrowaną na rysunku a każdy punkt tej otoczki (poza wierzchołkami) odpowiada pewnej strategii mieszanej Kolumny. Tak jak w rozdziale Rozwiązania gier w strategiach mieszanych poszukamy teraz strategii wyrównujących Kolumny. Takie strategie powinny spełniać równanie

\[\mathbb EW_A=\mathbb EW_B=\mathbb EW \,\]

czyli leżeć na prostej o tym równaniu nachylonej pod kątem \(1/2\) do osi \(\mathbb EW_A\,\) (czerwona przerywana linia). Wszystkie punkty otoczki leżące na tej prostej są strategiami wyrównującymi Kolumny. Ona jednak jest zainteresowana minimalizacją wygranej Wiersza a zatem wybierze strategię oznaczoną literą "S". Ta strategia leży na krawędzi otoczki wyznaczonej przez wypłaty opcji A i D Kolumny. Jak zatem widać z rysunku Kolumna powinna całkowicie odrzucić strategie B oraz C, które dają wyższe wygrane Wierszowi i powinna zagrać strategię mieszaną "S" wyznaczoną przez równanie

\[ \begin{bmatrix} -4 & 3 \\ 2 & -3\end{bmatrix} \begin{bmatrix} pK_{A} \\pK_{D}\end{bmatrix}= \begin{bmatrix} \mathbb EW \\ \mathbb EW\end{bmatrix}, \,\,\,\,\,\,\,pK_{D}=1-pK_{A}\,\]

co prowadzi, na podstawie wzorów ogólnej metody, do

\[ pK_{A}=pK_{D}=\frac{1}{2},\;\;\;\; pK_{B}=pK_{C}=0,\;\;\;\;\mathbb EW=-\frac{1}{2}.\]

W ten sposób Kolumna zapewni sobie, że niezależnie od strategii Wiersza nie będzie on w stanie wygrać więcej niż \(\mathbb EW\). Strategie A oraz D Kolumny nazywamy jej strategiami aktywnymi natomiast strategie B i C, których Kolumna nie powinna grać w ogóle - jej strategiami nieaktywnymi.

Z kolei Wiersz powinien założyć, że Kolumna gra racjonalnie i wybrać ze swojej strony strategię będącą najlepszą odpowiedzią na wyrównującą strategię kolumny. Obliczając opisaną wyżej metodą strategię Wiersza uzyskamy

\[ pW_{A}=\frac{5}{12},\;\;\;\;pW_{B}=\frac{7}{12},\;\;\;\; \mathbb EK=-\frac{1}{2}.\] W ten sposób Wiersz zapewni sobie, że niezależnie od strategii wybranej przez Kolumnę nie wygra ona więcej niż wynosi wartość gry. Zauważmy, że poszukując rozwiązania gry typu (2x4) bez punktów siodłowych i dominacji tak naprawdę zredukowaliśmy tę grę do podgry typu (2x2) poprzez wyeliminowanie strategii, które są mniej korzystne dla Kolumny.

Jak się można domyśleć zastosowana metoda eliminowania dodatkowych wymiarów może być zastosowana do dowolnej gry typy (2xn). Rzeczywiście punkt "S" zawsze leży na jednej krawędzi otoczki wypukłej zbudowanej na punktach macierzy wypłat odpowiadających kolejnym strategiom Kolumny. Redukcja dowolnej macierzy wypłat typu (2xn) polega na znalezieniu tych punktów metodą graficzną a następnie rozwiązaniu gry (2x2) zredukowanej du tych punktów. Podobną zasadę można zastosować do gier typu (mx2). Tym razem jednak redukować będziemy nadmiarowe strategie Wiersza a punktu "S" będziemy poszukiwać wśród najwyższych wygranych Wiersza a więc w prawym górnym punkcie przecięcia otoczki wypukłej z czerwoną linią \(\mathbb EW_A=\mathbb EW_B\,\) (por. zadanie 2).

Rozwiązania dowolnych gier o sumie zerowej

Zapisana w rozdziale Punkty siodłowe oraz dominacje definicja rozwiązania gry odwołuje się do pary strategii optymalnych oraz liczby \(\nu\,\) zwanej wartością gry. Jak dotychczas pokazaliśmy, że rozwiązania gier istnieją w przypadku, kiedy istnieją jej punkty siodłowe (lub da się ją zredukować do tej postaci drogą redukcji strategii zdominowanych) oraz kiedy gra jest typu (2x2), (mx2) lub (2xn). Pozostaje do rozpatrzenia problem ogólny dwuosobowych gier o sumie zerowej typu (mxn). Ten przypadek został rozwiązany przez Johna von Neumanna, który w 1928 roku udowodnił twierdzenie

Twierdzenie (J. von Neumann)
Każda dwuosobowa gra (mxn) o sumie zerowej ma rozwiązanie.

W tym miejscu nie będziemy dowodzić tego twierdzenia ale pokażemy sposób postępowania prowadzący do znajdywania rozwiązań. Sposób ten jest w dużej mierze powieleniem metody którą zastosowaliśmy do gier typu (mx2) lub (2xn). Polega on na tym, że dowolną grę typy (mxn) najpierw sprowadzamy do postaci kwadratowej (kxk). Taką grę (kxk) którą otrzymujemy z gry (mxn) drogą redukcji strategii zdominowanych i/lub eliminacji strategii nieaktywnych nazywamy podgrą gry oryginalnej. O grze tej zakładamy, że nie da sie jej dalej zredukować w opisany wyżej sposób. Pokazany w poprzednim rozdziale sposób redukcji do postaci kwadratowej metodą eliminacji strategii nieaktywnych, w przypadku gier o wymiarze trzy lub większym, może być trudny do wykonania. Zawsze jednak możemy przeprowadzić taką redukcję drogą rozważania wszystkich podgier kwadratowych a następnie wybranie przez gracza dysponującego większą liczbą opcji jako strategie aktywne, tylko tych, które dają mu najwyższą wygraną. Jeśli tak zrobi to sprowadzi grę do postaci kwadratowej. Pozostaje nam zatem pokazanie efektywnej metody rozwiązywania gier kwadratowych. W tym przypadku ogólna metoda nie różni się zanadto od metody pokazanej dla gier typu (2x2), zamiast układu równań 2x2 rozwiążemy jedynie układ o większym wymiarze.

W przypadku ogólnej gry typu (3x3) mamy do rozwiązania, analogicznie do gry typu (2x2), następujący układ równań

(12)\( \begin{bmatrix} w_{A,A} & w_{A,B} & w_{A,C} \\ w_{B,A} & w_{B,B} & w_{B,C}\\ w_{C,A} & w_{C,B} & w_{C,C}\end{bmatrix} \begin{bmatrix} pK_{A} \\ pK_{B} \\ pK_{C}\end{bmatrix}= \begin{bmatrix} \mathbb EW \\ \mathbb EW\\ \mathbb EW\end{bmatrix}, \,\,\,\, pK_{A}+ pK_{B} + pK_{C}=1. \)

Rozwiązaniem tego układu jest punkt przecięcia otoczki wypukłej trójwymiarowych wektorów kolumnowych macierzy gry z prostą \(\mathbb E W_{A}= \mathbb EW_B= \mathbb EW_C \,\). Istnienie takiego rozwiązania, o ile macierz gry nie da się zredukować do gry (2x2) lub (1x1) jest zagwarantowane przez twierdzenie Von Neumanna. Rozważmy dla przykładu grę

Przykład 2.11 Gra (3x3).
Macierz wypłat gry (3x3) bez punktów siodłowych i dominacji
2.11 Kolumna
Wiersz A B C
A 2 0 1
B 0 2 2
C 1 2 0

Graficzną reprezentację rozwiązania można znaleźć (rys. 3)

Rys. 3. Rys2swm.png

rysując trzy trójwymiarowe wektory odpowiadających strategiom A, B i C Kolumny

\[ \begin{bmatrix} 2 \\ 0\\1\end{bmatrix},\;\; \begin{bmatrix} 0\\ 2\\2\end{bmatrix},\;\; \begin{bmatrix} 1\\ 2\\0\end{bmatrix} \]

oraz otoczkę wypukłą generowaną przez te trzy wektory jako niebieski trójkąt rozpięty pomiędzy nimi. Z rysunku widzimy, że rozwiązaniem równania (12) jest przecięcie tego trójkąta z prostą o równaniu \[\mathbb EW_A=\mathbb EW_B=\mathbb EW_C \,\], narysowaną jako czerwona przerywana linia. Rozwiązaniem gry jest więc strategia mieszana odpowiadająca zaznaczonemu na rys. 3 czerwonemu punktowi.

Jak łatwo sprawdzić, rozwiązując układ trzech równań liniowych o trzech niewiadomych, rozwiązaniem tym jest strategia mieszana \[ pK_{A} = \frac{4}{9},\,\,\,\, pK_{B} = \frac{3}{9},\,\,\,\, pK_{C}=\frac{2}{9} \] a wartością gry jest \( \nu = \frac{10}{9}.\). Jako, że macierz gry jest symetryczna ze względu na transpozycję to rozwiązanie dla Wiersza będzie identyczne

\[ pW_{A} = \frac{4}{9},\,\,\,\, pW_{B} = \frac{3}{9},\,\,\,\, pW_{C}=\frac{2}{9}. \]

W podobny sposób można rozwiązać dowolną grę typu (3x3). W przypadku gier kwadratowych o większej ilości wymiarów rozwiązanie może wymagać większego wysiłku ale zawsze można go uzyskać stosując znane wzory Kramera na rozwiązania układu równań liniowych niejednorodnych.