TGND:Gry dwuosobowe o sumie zerowej

Z Skrypty dla studentów Ekonofizyki UPGOW

(Różnice między wersjami)
(Rozwiązania gier w strategiach mieszanych)
(Rozwiązania gier w strategiach mieszanych)
Linia 713: Linia 713:
Zauważmy, że jeżeli zechcemy aby <big><math>WOW_A=WOW_B</math></big>, tzn.
Zauważmy, że jeżeli zechcemy aby <big><math>WOW_A=WOW_B</math></big>, tzn.
<big>
<big>
-
:<math>-3 + 5 pK_A = 1 - pK_A</math>,
+
:<math>-3 + 5 pK_A = 1 - pK_A\,</math>,
</big>
</big>
to wyliczona stąd wartość <big><math>pK_A=2/3</math></big> wyznacza strategię Kolumny <big><math>[2/3, 1/3]_K</math></big>  taką, dla której wartość oczekiwana wypłaty Wiersza nie będą zależały od wybranej przezeń opcji. Taką strategię nazywamy ''strategią wyrównującą'' Kolumny. Jeśli Kolumna ją zastosuje to ta wartość oczekiwana będzie równa  
to wyliczona stąd wartość <big><math>pK_A=2/3</math></big> wyznacza strategię Kolumny <big><math>[2/3, 1/3]_K</math></big>  taką, dla której wartość oczekiwana wypłaty Wiersza nie będą zależały od wybranej przezeń opcji. Taką strategię nazywamy ''strategią wyrównującą'' Kolumny. Jeśli Kolumna ją zastosuje to ta wartość oczekiwana będzie równa  

Wersja z 07:32, 10 wrz 2010

Spis treści

Gry dwuosobowe o sumie zerowej

Gry oraz diagramy przesunięć

Gra
Przez grę rozumiemy zespół zasad określający wypłatę dla graczy jako funkcje wybranych opcji, które są możliwe dla danej gry.

Aby mówić o grze musimy wskazać co najmniej dwu graczy. Każdy z tych graczy ma możliwość wyboru spośród pewnej liczby możliwych opcji. Gracze podejmują swoje decyzję równocześnie lub, co na to samo wychodzi, nie znając wyborów pozostałych graczy - taką grę nazywamy symultaniczną. Mogą też wybierać swoje opcje jako odpowiedź na wybór dokonany przez pozostałych graczy, w takim przypadku mówimy o grach 'sekwencyjnych'. Gra może składać się z jednej lub wielu rund, w trakcie których gracze dokonują swoich wyborów. Przez strategię, jak już to wspomnieliśmy we wstępie, rozumiemy przyjęty przez gracza sposób wybierania jednej z możliwych opcji. Strategie mogą być proste, wówczas gracz po prostu wybiera jedną opcję lub mieszane, wówczas gracz decyduje się na wybór kilku opcji z określeniem prawdopodobieństwa wyboru każdej z nich.

Jeśli każdej możliwej kombinacji opcji wybranych przez graczy przyporządkujemy (jednoznacznie) wypłatę dla każdego z nich to taki przepis nazywamy zasadą gry. Wypłatą gracza nazywamy mierzalny sposób określenia jego wyniku. Wypłaty zazwyczaj określamy w sposób liczbowy aby ułatwić ich sumowanie i podliczanie wyników gry. Można jednak definiować gry w których wypłaty są dobrami materialnymi, zobowiązaniem do wykonania jakiejś czynności (np. że gracz, który przegra stanie na głowie), etc. Zasady gry mogą być przedstawione w postaci macierzowej tzw. tabeli wypłat. Poniżej przedstawiamy przykładową tabelę.

Przykład 2.1 Tabela gry.
Przykład macierzy wypłat dla gry dwuosobowej
2.1 Basia (Kolumna)
Adam (Wiersz) A B
A 1, -1 -2, 2
B -1, 1 0, 0
C -4, 4 5, -5

Graczami są Adam i Basia. W dalszej części odpersonalizujemy Adama i będziemy go nazywać (panem) Wierszem a Basię (panią) Kolumną. W grze 2.1 Adam ma do wybory trzy opcje (strategie proste): A, B oraz C a Basia dwie strategie: A oraz B. W zależności od dokonanych wyborów uzyskują wypłaty zapisane w tabeli. Wypłaty Adama są oznaczone kolorem niebieskim a wypłaty Basi kolorem czerwonym. Jak łatwo zauważyć wypłaty Adama są zawsze liczbami przeciwnymi do wypłat Basi. Tyle ile jedno z nich wygra drugie musi przegrać. Grę w której mamy do czynienia z taką sytuacją nazywamy grą o sumie zerowej. Dla gier o sumie zerowej przyjmujemy upraszczające konwencję zapisu, w której tabela wypłat zawiera tylko wypłaty Wiersza, wypłaty Kolumny są przeciwne do wypłat wiersza. W przypadku gry 2.1. uproszczona tabela ma postać

Uproszczona macierz pokazująca tylko wypłaty Wiersza
2.1 Kolumna
Wiersz A B
A 1 -2
B -1 0
C -4 5

Przeanalizujmy teraz, jak wygląda nasza przykładowa gra 2.1 z punktu widzenia opłacalności poszczególnych wyborów graczy. Jeśli Wiersz wybierze opcję A to kolumnie opłaca się wtedy wybrać B, gdyż dla opcji A Kolumna przegrywa \(1\) a w opcji B Kolumna wygrywa \(2\). Na diagramie przesunięć poniżej oznaczono ten fakt przy pomocy strzałki w prawo w polu (A,A). Zauważmy, że strzałka ta jest skierowana od wartości większej \((1)\) do mniejszej \((-2)\) zgodnie z konwencją, że wygrane Kolumny są liczbami przeciwnymi do wygranych wiersza. A zatem ta strzałka, tak naprawdę wskazuje preferencje Kolumny: zakładając, że Wiersz pozostanie przy opcji A, wybór B Kolumny jest dla niej korzystniejszy niż A \((2 > -1)\). Można podsumować, że poziome strzałki diagramu przesunięć są zawsze skierowane od wartości większych do mniejszych oraz wskazują preferowane opcje Kolumny.

Diagram przesunięć
Macierzy pokazująca dla każdej pary wyborów preferencje graczy
2.1 Kolumna
Wiersz A B
A \(\rightarrow\) \(\downarrow\)
B \(\uparrow\) \(\leftarrow \; \downarrow\)
C \(\uparrow\) \(\leftarrow\)

Preferowane opcje Wiersza wskazują strzałki pionowe, które są zawsze skierowane od wartości mniejszych do większych, zgodnie z preferencjami Wiersza. Strzałka skierowana w dół w polu (B,B) oznacza, że przy zadanym wyborze B Kolumny, opcja C jest dla Wiersza korzystniejsza niż B. Zauważmy, że w polu (B,B) znajduje się również strzałka skierowana w lewo. Oznacza ona, że przy zadanym wyborze B Wiersza, opcja A jest dla Kolumny korzystniejsza niż B. W każdym polu diagramu przesunięć gry 2.1 znajduje się jakaś strzałka. Oznacza to, że nie ma w tej grze pary wyborów, która byłaby korzystna dla oby graczy: dla każdej pary wyborów jeden z graczy może znaleźć opcję korzystniejszą, przy założeniu, że partner pozostanie przy swojej. Ta sytuacja jednak nie zawsze ma miejsce, zobaczmy bowiem kolejną grę:

Przykład 2.2 Gra z punktem równowagi.
Macierz wypłat 2.2
2.2 Kolumna
Wiersz A B C
A -1 3 1
B 0 2 0

Diagram przesunięć dla tej gry wygląda następująco:

Diagram przesunięć dla gry 2.2
2.2 Kolumna
Wiersz A B C
A \(\downarrow\) \(\leftarrow \; \; \; \; \rightarrow\)
B \(\leftarrow \; \uparrow \; \rightarrow\) \(\uparrow\)

Jak widzimy w polach (B,A) i (A,C) nie ma żadnych strzałek. Oznacza to, że jeśli gracze znajdą się w jednym z tych punktów, to żadnemu z nich nie opłaca się jednostronnie zmieniać swojej opcji na sąsiednią. Takie miejsca nazywamy punktami równowagi. Zauważmy, że punkty równowagi jest określony lokalnie, poprzez wartości wypłat pól sąsiednich. Jaką strategię powinni obrać graczy w tej grze? Dla Wiersza korzystniejszą jest równowaga (A,C) - wygrana \(1\) niż (B,A) - wygrana \(0\). Załóżmy więc, że wybierze on opcję A. Wtedy jednak Kolumna szybko zauważy, że lepiej jej jest nie grać swojej opcji C dla równowagi (A,C) gdyż opcja A jest dla nie korzystniejsza. Jeśli Wiersz to zauważy to sam powinien zagrać B, co doprowadzi graczy do drugiej równowagi (B,A). Po osiągnięciu tej równowagi, żaden z graczy nie jest zainteresowany zmianą swojej strategii: wygrana \(0\) jest bowiem dla wiersza najwyższa w kolumnie A, natomiast dla Kolumny jest ona nie mniej korzystna niż inne w wierszu B. Żaden z graczy nie może wygrać więcej przez jednostonną zmianę swojej strategii.

Punkty siodłowe oraz dominacje

Rozpoczniemy od definicji punktu siodłowego

Punkt siodłowy
Punkt macierzy wypłat, którego wartość jest nie większa od innych wartości w jego wierszu oraz nie mniejsza od innych wartości w jego kolumnie nazywamy punktem siodłowym. Na punkt siodłowy składa się para zawierających go strategii oraz odpowiadająca im wygrana \( \nu \), którą nazywamy wartością gry.

W grze 2.2 punktem siodłowym jest równowaga (B,A). Wiersz grając należącą do punktu siodłowego strategię B może być pewien, że nie wygra mniej niż wynosi wartość gry \(0\) a Kolumna grając należącą do punktu siodłowego strategię A ma pewność, że Wiersz nie wygra więcej niż wynosi wartość gry.

Zauważmy, że niezależnie od strategii Wiersza, Kolumna może z góry wykluczyć swoją strategię B. Istotnie, Strategia B jest zawsze gorsza od strategii A i strategii C Kolumny. Obrazują to poziome strzałki na diagramie przesunięć gry 2.2. Ten przypadek ilustruje ważne pojęcie strategii zdominowanej.

Strategia zdominowana
Mówimy, że strategia X gracza jest zdominowana przez strategię Y tego gracza jeżeli X i Y nie są identyczne a niezależnie od strategii przeciwnika wypłata przy wyborze X jest niewiększa od wypłaty przy wyborze Y. W tym przypadku mówimy również, że strategia Y gracza dominuje strategię X.

Jak widzimy na przykładzie 2.2 strategia B Kolumny jest zdominowana przez strategię A oraz przez strategię C. Istotnie dla wypłaty Kolumny porównując B z A mamy \(-3<1\) i \(-2<0\). Podobnie rzecz się ma przy porównaniu B z C. Jeśli jakaś strategia jest zdominowana przez inną to gracz może tej strategii nie brać pod uwagę w rozgrywce. Rzeczywiście zamiast tej strategii może zawsze wybrać inną, która ją dominuje a jego wygrana będzie co najmniej równa wygranej dla strategii zdominowanej.

Załóżmy, że mamy do czynienia z racjonalnymi graczami, którzy nie wybierają strategii dla siebie niekorzystnych. W tym przypadku analizując grę możemy ją uprościć usuwając z niej wszystkie strategie zdominowane. W przypadku gry 2.2 możemy spokojnie usunąć strategię B Kolumny. W tym przypadku gra przybierze postać


Przykład 2.2' Gra 2.2 bez strategii zdominowanej.
Macierz wypłat 2.2'
2.2' Kolumna
Wiersz A C
A -1 1
B 0 0

Na diagramie przesunięć dla tej gry znajdziemy jeden punkt równowagi (B,A):

Diagram przesunięć dla gry 2.2'
2.2 Kolumna
Wiersz A C
A \(\downarrow\) \(\leftarrow\)
B \( \uparrow\)

Zauważmy, że punkt równowagi (B,A) jest jednocześnie punktem siodłowym. Wyeliminowanie z gry strategii zdominowanej uprościło jej analizę i z dwu punktów równowagi pozostał tylko jeden - ten który jest jednocześnie punktem siodłowym. Przeanalizujmy teraz bardziej złożoną grę, w której każdy z graczy ma po 4 opcje wyboru.

Przykład 2.3 Gra z kilkoma punktami siodłowymi.
Macierz wypłat 2.3
2.3 Kolumna
Wiersz A B C D
A 2 1 3 1
B -1 0 7 -5
C 9 1 5 1
D 1 0 7 -2

Diagram przesunięć dla tej gry wygląda następująco:

Diagram przesunięć dla gry 2.3
2.3 Kolumna
Wiersz A B C D
A \(\rightarrow\) \(\leftarrow \; \downarrow \; \rightarrow\)
B \(\updownarrow\) \(\leftarrow \; \updownarrow\) \(\leftarrow \; \; \; \; \rightarrow\) \(\updownarrow\)
C \(\rightarrow\) \(\leftarrow \; \updownarrow \; \rightarrow\)
D \(\uparrow \; \rightarrow\) \(\uparrow\) \(\leftarrow \; \; \; \; \rightarrow\) \(\uparrow\)

W tej grze można wyeliminować strategię C Kolumny, jest ona zdominowana zarówno przez strategię B jak i D a zatem racjonalny gracz nie powinien jej wybierać. Wiedząc o tym, Wiersz powinien więc planować swoje wybory uwzględniając, że Kolumna nie zagra strategii C. Po wyeliminowaniu jej uzyskamy grę:


Przykład 2.3' Gra z kilkoma punktami siodłowymi.
Macierz wypłat 2.3'
2.3 Kolumna
Wiersz A B D
A 2 1 1
B -1 0 -5
C 9 1 1
D 1 0 -2

dla której diagram przesunięć jest

Diagram przesunięć dla gry 2.3'
2.3' Kolumna
Wiersz A B D
A \(\rightarrow\)
B \(\updownarrow\) \(\leftarrow \; \updownarrow \; \rightarrow\) \(\updownarrow\)
C \(\rightarrow\)
D \(\uparrow \; \rightarrow\) \(\uparrow \; \rightarrow\) \(\uparrow\)

Zauważmy, że w zmodyfikowanej grze 2.3' strategie B i D Wiersza również są zdominowane na przykład przez strategię C. Dla Wiersza oznacza to, że może tych strategii nie brać pod uwagę, co dodatkowo znacznie uprości grę do postaci


Przykład 2.3\(''\) Gra z kilkoma punktami siodłowymi.
Macierz wypłat 2.3\(''\)
2.3\(''\) Kolumna
Wiersz A B D
A 2 1 1
C 9 1 1

dla której diagram przesunięć jest

Diagram przesunięć dla gry 2.3\(''\)
2.3\(''\) Kolumna
Wiersz A B D
A \(\rightarrow\)
C \(\rightarrow\)

.

A teraz już tylko jeden krok do rozwiązania gry, które otrzymamy po wyeliminowaniu zdominowanej strategii A Kolumny (zauważmy, że Kolumna nie mogła wyeliminować swojej strategii A już w pierwszym kroku, gdyż w pierwotnej postaci gry 2.3 ta strategia nie jest zdominowana). Po tej trzystopniowej redukcji strategii zdominowanych gra 2.3 sprowadza się do prostej formy

Przykład 2.3\('''\) Gra z kilkoma punktami siodłowymi.
Macierz wypłat 2.3\('''\)
2.3\('''\) Kolumna
Wiersz B D
A 1 1
C 1 1

dla której diagram przesunięć jest oczywiście pusty. Rozwiązanie gry 2.3 mówi nam, że Wiersz powinien grać strategię A lub C a Kolumna strategię B lub D. Grając te strategie obaj gracze mają gwarancję, że ich wynik będzie nie gorszy niż wynosi wartość gry, którą jest w tym przypadku \( \nu=1 \). Zauważmy, że pary strategii (A,B), (A,D), (C,B) i (C,D) są punktami siodłowymi gry w każdej jej postać od 2.3 do 2.3\('''\). W pierwotnej postaci gry para strategii (D,A) również dawała wygraną równą wartości gry \( \nu=1 \) ale para ta nie jest punktem siodłowym. Istotnie, gdyby na przykład wiersz zdecydował się zagrać strategię D to Kolumna mogłaby zagrać również D uzyskując dla siebie wynik \(2\) dużo korzystniejszy niż wartość gry.

Rozwiązanie gry
Rozwiązaniem gry nazywamy parę strategii optymalnych oraz jej wartość \(\nu\) czyli wypłatę, odpowiadającą tym strategiom. Strategia gracza jest optymalną, jeżeli jego wygrana będzie równa co najmniej \(\nu\), niezależnie od strategii przyjętej przez drugiego gracza.

Zauważmy, że każdy punkt siodłowy jest rozwiązaniem gry. Gra 2.3 ma zatem 4 rozwiązania, odpowiadające wartości gry \( \nu=1 \). Czy możliwa jest sytuacja w której gra ma kilka punktów siodłowych odpowiadających różnym wartościom wygranej? Gdyby tak było, to nie można by jednoznacznie określić wartości gry. Na szczęście taka sytuacja nie może mieć miejsca. Zachodzi bowiem twierdzenie

Twierdzenie. Każde dwa punkty siodłowe tej samej gry odpowiadają tej samej wypłacie.
Dowód
załóżmy, że para strategii (X\(_{1}\),Y\(_{1}\)) odpowiada wypłacie \( \nu_{1,1}\) a para strategii (X\(_{2}\),Y\(_{2}\)) odpowiada wypłacie \( \nu_{2,2}\) oraz (X\(_{1}\),Y\(_{1}\)) i (X\(_{2}\),Y\(_{2}\)) są punktami siodłowymi. Pokażemy, że \( \nu_{1,1}=\nu_{2,2}\). Gdyby X\(_{1}\) = X\(_{2}\) to \( \nu_{1,1}=\nu_{1,2}\) gdyż z definicji żaden z dwu punktów siodłowych w jednym wierszu nie może być większy od drugiego. Podobnie pokazujemy tezę dla Y\(_{1}\) = Y\(_{2}\). Możemy więc założyć, że strategie X\(_{1}\) i X\(_{2}\) są różne podobnie jak Y\(_{1}\) i Y\(_{2}\). Rozważmy dodatkowe pary strategii (X\(_{1}\),Y\(_{2}\)) i (X\(_{2}\),Y\(_{1}\)), oraz odpowiadające im wypłaty \( \nu_{1,2}\) i \( \nu_{2,1}\) (por. tabela 2.4). Zauważmy, że z definicji punktu siodłowego wynika, że wszystkie wartości w wierszu są nie mniejsze od \( \nu_{1,1} \) i \( \nu_{2,2}\) więc
Tabela 2.4
2.4 Kolumna
Wiersz ... Y\(_{1}\) ... Y\(_{2}\) ...
... ... ... ... ... ...
X\(_{1}\) ... \(\nu_{1,1}\) ... \(\nu_{1,2}\) ...
... ... ... ... ... ...
X\(_{2}\) ... \(\nu_{2,1}\) ... \(\nu_{2,2}\) ...
... ... ... ... ... ...

\[ \nu_{1,1} \leqslant \nu_{1,2} \] oraz \( \nu_{2,2} \leqslant \nu_{2,1} \).

Podobnie z definicji punktu siodłowego wynika, że wszystkie wartości w kolumnie są nie większe od \( \nu_{1,1}\) i \( \nu_{2,2}\) więc

\[ \nu_{2,1}\leqslant\nu_{1,1} \] oraz \( \nu_{1,2} \leqslant \nu_{2,2} \).

Z nierówności tych wynika bezpośrednio, że

\[ \nu_{1,1}=\nu_{1,2}=\nu_{2,2}=\nu_{2,1} \;\]

A zatem udowodniliśmy twierdzenie pokazując ponadto dodatkowe dwa punkty siodłowe, które wraz z pierwotnie wybranymi tworzą prostokąt w tabeli wypłat.

Maksimin i minimaks

Poszukiwanie punktów siodłowych metodą redukcji strategii zdominowanych tak jak to pokazaliśmy w przykładzie 2.3 udaje się tylko dla niektórych gier. W ogólnym przypadku taka metoda jest nieskuteczna. W tym rozdziale zajmiemy się ogólną metodą poszukiwania punktów siodłowych za pomocą wyznaczania maksiminu i minimaksu. Aby to zrobić ponownie odwołamy się do przekładu gry podobnej do 2.3 tyle, że zmienimy w niej jedną wypłatę, odpowiadającą strategii (C,C) - wartość 5 zamienimy na 0. Jak widać z przedstawionej poniżej tabeli wypłat po takiej zmianie żaden a wierszy ani żadna z kolumn nie jest zdominowana przez inne.

Przykład 2.5 Wyznaczanie punktów siodłowych metodą maksiminu i minimaksu.
Maksimin jest maksymalną spośród wypłat minimalnych w wierszach a minimaks jest minimalną spośród wypłat maksymalnych w kolumnach macierzy
2.5 Kolumna minima
wierszy
maksimin
Wiersz A B C D
A 2 1 3 1 1 1
B -1 0 7 -5 -5
C 9 1 0 1 0
D 1 0 7 -2 -2
maksima kolumn 9 1 7 1
minimaks 1 1

Z definicji punkt siodłowy ta taki, którego wartość jest nie większa on innych w jego wierszu. Poszukajmy zatem najmniejszych wartości w każdym wierszu. W przykładzie 2.5 pokazano je jako "minima wierszy", jeśli gra miałaby punkt siodłowy to musiałby on znaleźć się na tej liście. Z drugiej jednak strony punkt siodłowy to taki, którego wartość jest nie mniejsza od innych w jego kolumnie. Poszukajmy więc największych wartości w poszczególnych kolumnach. W tabeli 2.5 pokazano je jako "maksima kolumn". Teraz jest jasne, że aby gra miała punkt siodłowy, musi on należeć do obu tych list. Ale maksima kolumn są nie mniejsze niż minima wierszy dlatego jedyną możliwością znalezienia części wspólnej obu tych list jest porównanie minimalnego maksimum kolumn i maksymalnego minimum wierszy. Jeśli te dwie liczby są równe to ich wspólna wartość jest punktem siodłowym oraz wartością gry \( \nu \). Minimalne maksimum kolumn nazywamy minimaksem a maksymalne minimum wierszy nazywamy maksiminem. Udowodniliśmy zatem twierdzenie

Twierdzenie o maksiminie i minimaksie
Jeśli maksimin i minimaks gry macierzowej są równe to gra posiada punkt lub punkty siodłowe o tej wartości. Punkty te leżą na przecięciu wierszy i kolumn których minima i maksima są równe tej wartości. Jeśli maksimin jest mniejszy od minimaksu to gra nie posiada punktów siodłowych.

Jak widać w przypadku gry 2.5 ma ona dwa punkty siodłowe (A,B) i (A,D) o wartości wspólnej maksiminu i minimaksu \( \nu=1 \). Inne pary strategii o wartości 1, t.j (C,B), (C,D) i (A,E) nie są punktami siodłowymi gdyż nie leżą na przecięciu wierszy i kolumn których zarówno minima jak i maksima są równe 1.

Strategie mieszane

W poprzednim rozdziale pokazaliśmy, że poszukiwanie punktów siodłowych jest wygodnym sposobem poszukiwania rozwiązań gier o sumie zerowej. Zauważyliśmy również, że aby gra miała punkt siodłowy musi zachodzić równość minimaksu i maksiminu dla tabeli tej gry. Powróćmy jeszcze raz do pierwszego rozważanego przykładu 2.1. Jak widzimy dla tej gry taka równość nie zachodzi bo maksimin=1 a minimaks=-1.

Przykład 2.6 Gra bez punktów siodłowych.
W tej grze maksimin=1 a minimaks=-1 więc nie ma punktu siodłowego
2.6 Kolumna minima
wierszy
maksimin
Wiersz A B
A 1 -2 -2
B -1 0 -1 -1
C -4 5 -4
maksima kolumn 1 5
minimaks 1

Na diagramie przesunięć gry 2.1 nie ma żadnego punktu równowagi. Oznacza to, że nie istnieje taka para opcji dla Wiersza i Kolumny która, gdyby była wybrana, zapewniłaby im wygraną równą wartości gry. Wszak taka para musiałaby być równowagą, której w naszej grze brak. Czyżby zatem gra 2.1 nie miała rozwiązania? Okazuje się, że takie rozwiązanie istnieje, tyle, że oparte jest o tzw. strategie mieszane.

Strategia mieszana
Strategią mieszaną nazywamy taki sposób gry w którym gracz Wiersz (Kolumna) wybiera dostępne opcje A, B, C,... w sposób losowy w prawdopodobieństwem \(pW_A\), \(pW_B\), \(pW_C\),... (\(pK_A\), \(pK_B\), \(pK_C\),...). Taką strategię oznaczamy symbolem \([pW_A, pW_B, pW_C...]_W\) (\([pK_A, pK_B, pK_C...]_K\) odpowiednio).

A zatem strategia mieszana jest sposobem na gry, które są rozgrywane wielokrotnie - dopiero wtedy nabiera znaczenia to, że poszczególnym opcjom gracza odpowiada prawdopodobieństwo ich wybrania. Strategią mieszaną będzie na przykład użycie przez Wiersz monety do losowania jednej z dwu opcji A i B. W tym przypadku odpowiednie prawdopodobieństwa powinny wynosić \(pW_A=pW_B=1/2\). Przy stosowaniu strategii mieszanej wygraną gracza da się określić tylko jako jej wartość oczekiwana.

Wartość oczekiwana wypłaty
Jeżeli prawdopodobieństwa uzyskania wypłat \(a_1, a_2,...a_k\) wynoszą odpowiednio \(p_1, p_2,...p_k\), (\(p_1 + p_2+...+p_k=1\)) to wartością oczekiwaną wypłaty (\(WO\)) jest

\[WO=a_1 p_1 + a_2 p_2 +...+ a_k p_k\]

Przykład
Jeśli w grze 2.6 Kolumna zagra opcję A z prawdopodobieństwem \(pK_A=1/2\) i B z prawdopodobieństwem \(pK_B=1/2\) czyli wybierze strategię \([1/2, 1/2]_K\) to wartość oczekiwana wypłaty Wiersza przy wyborze opcji A (którą oznaczamy \(WOW_A\)) wynosi

\[WOW_A=\frac {1}{2} 2 + \frac {1}{2} (-3) = -\frac {1}{2}\],

podobnie wartość oczekiwana wypłaty Wiersza przy wyborze opcji B (\(WOW_B\)) wynosi

\[WOW_A=\frac {1}{2} 0 + \frac {1}{2} 1 = \frac {1}{2}\].

Zauważmy, że granie według strategii mieszanej jest jakościowo różne od strategii prostej. W przypadku tej pierwszej nie mamy jednoznacznej recepty którą opcję należy przy danym wyborze wybrać, wiemy tylko z jakim prawdopodobieństwem mamy ją wybrać. Sytuacja nieco przypomina opis świata fizycznego przy pomocy mechaniki klasycznej i kwantowej. W tej pierwszej, mamy dokładną informację co do "parametrów gry": położeń, prędkości poszczególnych cząstek. W mechanice kwantowej wiemy jedynie, lub obserwujemy, jakie są prawdopodobieństwa przyjęcia poszczególnych wartości przez te "parametry". W tym miejscu nie będziemy bardziej rozwijać tej analogii, zainteresowanych odsyłam do prac Sładkowskiego i Piotrowskiego.

Osobnym tematem pozostaje sposób realizacji strategii mieszanej. Sprawę wyjaśnijmy na przykładzie. Gdyby Kolumna mając do wyboru dwie opcje A i B jak w przykładzie 2.6 miała zagrać strategią \([2/3, 1/3]_K\) to jak ją zrealizuje? Można by przypuszczać, że powinna grać B w co trzeciej grze, tzn. wybierając A,A,B,A,A,B,... , gdyż w ten sposób zrealizowałaby żądany rozkład prawdopodobieństwa. Przypuszczamy jednak, że Wiersz, gdyby to zauważył natychmiast wykorzystałaby tą wiedzę i dopasował swoją strategię grając sekwencję: A,A,C,A,A,C,... w której jego wypłata po każdej sekwencji trzech wyborów wynosiłaby 7. Byłby to najgorszy z możliwych scenariuszy dla Kolumny. Aby zagrać strategią \([2/3, 1/3]_K\) Kolumna powinna to zrobić w sposób losowy. Można w tym celu wykorzystać np rzut kostką i wybierać B tylko gdy wypadnie "5" lub "6", losować "z kapelusza", można w losowy sposób otwierać kartki książki i wybierać "B" gdy numer strony jest podzielny przez 3, spoglądać na sekundnik zegarka i stosować tę samą zasadę dla zaobserwowanej akurat sekundy. (Lepiej jednak spojrzenie na zegarek ukryć przed Wierszem bo może odgadnąć zasadę i wykorzystać swój zegarek.) Można wykorzystać jakikolwiek inny ""generator"" losowy.

Rozwiązania gier w strategiach mieszanych

Poszukamy teraz metody znajdywania rozwiązań gier, które nie mają punktów siodłowych przy pomocy strategii mieszanych. Rozważmy następującą grę bez punktów siodłowych

Przykład 2.7 Gra bez rozwiązań w strategiach prostych
W tej grze maksimin=0 a minimaks=1 więc nie ma punktu siodłowego
2.7 Kolumna minima
wierszy
maksimin
Wiersz A B
A 2 -3 -3
B 0 1 0 0
maksima kolumn 2 1
minimaks 1

Załóżmy że Kolumna w tej grze gra strategią \([pK_A, pK_B]_K\). Wówczas wartość oczekiwana wygranych Wiersza będzie: \[WOW_A=pK_A(2) + (1-pK_A)(-3) = -3 + 5 pK_A\], \[WOW_B=pK_A(0) + (1-pK_A)(1) = 1 - pK_A\],

Zauważmy, że jeżeli zechcemy aby \(WOW_A=WOW_B\), tzn. \[-3 + 5 pK_A = 1 - pK_A\,\], to wyliczona stąd wartość \(pK_A=2/3\) wyznacza strategię Kolumny \([2/3, 1/3]_K\) taką, dla której wartość oczekiwana wypłaty Wiersza nie będą zależały od wybranej przezeń opcji. Taką strategię nazywamy strategią wyrównującą Kolumny. Jeśli Kolumna ją zastosuje to ta wartość oczekiwana będzie równa

\(WOW_A=WOW_B=1/3\),

niezależnie od zastosowanej przez Wiersz strategii. Ale Wiersz również ma swoją strategię wyrównującą, którą obliczymy zakładając, że \(WOK_A=WOK_B\), gdzie \[WOK_A=pW_A(2) + (1-pW_A)(0) = 2pW_A\], \[WOW_B=pW_A(-3) + (1-pW_A)(1) = 1 - 4pW_A\], czyli \(pW_A=1/6\), co daję strategię wyrównującą Wiersza \([1/6, 5/6]_W\). Wartość oczekiwana wygranej Kolumny przy tej strategii jest taka sama \(WOK_A=WOK_B=1/3\).

Można więc powiedzieć, że strategie wyrównujące dają nam parę strategii optymalnych dla obu graczy \([2/3, 1/3]_K\), \([1/6, 5/6]_W\) oraz wartość gry wyrażoną jako wartość oczekiwaną wygranej obu graczy \(\nu=1/3\) czyli rozwiązanie gry 2.7 wyrażone w strategiach mieszanych.

Przykłady gier

przyklado.