戦略形ゲーム

提供:ORWiki
移動: 案内, 検索

【せんりゃくけいげーむ (strategic form game)】

概要

プレイヤーの集合, 各プレイヤーのとりうる戦略の集合, および, 各プレイヤーの利得関数を記述することによりゲームを表現する形式. 標準形ゲームともいう.

詳説

 ゲームに参加するプレイヤーの集合をN\, , 各プレイヤーi\, のとりうる戦略の全体をS_i\, , およびS=S_1 \times \cdots \times S_n\, 上で定義された各プレイヤーi\, フォンノイマン・モルゲンシュテルン効用関数 (von Neumann-Morgenstern utility function) をu_i\, とするとき,


G=(N; S_1, \ldots , S_n; u_1, \ldots , u_n)\,


戦略形ゲーム (game in strategic form) または標準形ゲーム (game in normal form) という. N\, S_i\, がすべて有限集合であるとき, G\, を有限ゲームという. 効用関数u_i\, は, また利得関数 (payoff function) ともいい, その値を利得という.

 戦略形で書かれたゲームは, 特にことわらない限り非協力ゲームである. 戦略の数が有限な2人ゲームは次のような利得双行列 (payoff bimatrix) で表現することができるので, 双行列ゲーム (bimatrix game) ということがある.


Sk-0071-a-g-03-1.png


 ここに, 縦の1, \ldots, m\, はプレイヤー1の戦略, 横の1, \ldots, n\, はプレイヤー2の戦略であり, a_{ij}, b_{ij}\, は, プレイヤー1, 2が各々戦略i, \ j\, をとったときの, プレイヤー1, 2の利得である. a_{ij}\, を成分とする行列をA\, , b_{ij}\, を成分とする行列をB\, と表し, 利得双行列を簡単に(A, B)\, と表す. すべてのi, \ j\, について, a_{ij} + b_{ij} = 0\, となる場合が2人ゼロ和ゲーム (two-person zerosum game) の戦略形である. 行列B\, A\, の符号を変えたものであり, 行列A\, だけでゲームを記述できるので2人ゼロ和ゲームを行列ゲーム (matrix game) ということもある.

 双行列ゲーム(A, B)\, において, 各プレイヤーの混合戦略 (mixed strategy) を各々p=(p_1, \ldots , p_m)\, , q=( q_1, \ldots , q_n)\, とすると, 各プレイヤーの利得の期待値 (期待利得) は各々 pAq^{\top}\, および pBq^{\top}\, で与えられる. q^{\top}\, q\, の転置ベクトルを表す. また, 混合戦略に対してもとの戦略を純戦略 (pure strategy) という. ナッシュ均衡 (p^*, q^*)\, は, 非協力ゲーム理論の項で述べた定義によって,


p^*Aq^{*\top} \ge pAq^{*\top}, \  p^*Bq^{*\top} \ge p^*Bq^{\top}, \ \mbox{ for all } p, \ q \,


をみたす混合戦略の組である. とくに, ゼロ和ゲームでは, B=-A\, であるから


pAq^{*\top} \le p^*Aq^{*\top} \le p^*Aq^{\top} , \ \ \mbox{ for all } p, \ q \,


となり, これからミニマックス定理 (minimax theorem) 


\mbox{max}_{p} \mbox{min}_{q} \ pAq^{\top} \ =\ \mbox{min}_{q}\mbox{max}_{p}\ \ pAq^{\top} \,


が導かれ, さらにこの値はp^*Aq^{*\top}\, に等しい. 左辺の値をマックスミニ値 (maxmin value), 右辺の値をミニマックス値(minimax value), さらに, この共通の値をゲームの値 (value of a game) という. また, このときの戦略p^*, \ q^*\, を各々マックスミニ戦略 (maxmin strategy), ミニマックス戦略 (minimax strategy) という.  次に示すのは, 左が囚人のジレンマ (prisoner's dilemma), 右が逢い引きのジレンマ (battle of the sexes) という名で知られる有名な双行列ゲームである.


Sk-0071-a-g-03-2.png


囚人のジレンマでは, 純戦略の組 (d, \ d)\, のみが, また, 逢い引きのジレンマでは, 純戦略の組 (a, \ a)\, および(b, \ b)\, と, 混合戦略の組 ((2/3, 1/3)\, , (1/3, 2/3))\, がナッシュ均衡である. とくに, 囚人のジレンマのナッシュ均衡では, 戦略d\, は相手のすべての戦略に対する最適反応 (best reply) となっている. このようなナッシュ均衡を, 支配戦略均衡 (dominant strategy equilibrium) ということがある. 逢い引きのジレンマには支配戦略は存在しない. また, 逢い引きのジレンマでは, 混合戦略ナッシュ均衡における利得の組(2/3, \ 2/3)\, は, たとえば純粋戦略ナッシュ均衡(a, \ a)\, における利得の組(2, \ 1)\, に対して各プレイヤーについて劣っている. このとき, 利得の組(2/3, \ 2/3)\, (2, \ 1)\, パレート支配 (Pareto dominate) されるという.

 戦略形ゲームにおいて, もし, 各プレイヤーが共通の偶然機構にもとづいて戦略を選ぶことが許されているならば, 各プレイヤーは互いに相関した行動をとることができる. このような戦略を相関戦略 (correlated strategy) という. たとえば, 逢い引きのジレンマで, コインを投げて表が出たら戦略の組(a, \ a)\, , 裏が出たら(b, \ b)\, とすることに2人が合意したとしよう. つまり, 2人とも, 表が出たらa\, をとり, 裏が出たらb\, をとるという相関戦略をとるものとする. このような合意がナッシュ均衡になるとき, すなわち, 相関戦略の組がナッシュ均衡となっているとき, これを相関均衡 (correlated equilibrium) という. 上に述べた相関戦略の組は相関均衡であり, 2人の期待利得はともに3/2\, となることが容易にわかる. また, 混合戦略均衡は互いに独立な相関戦略からなる相関均衡にほかならない. 相関均衡の正式な定義については, たとえば [3] など参照.  


 以上のゲームでは, 戦略形G\, についての知識がすべてのプレイヤーの間で共有知識 (common knowledge) であると仮定されており, これらは完備情報ゲーム (game with complete information) といわれている. 他方, 不完備情報ゲームはハルサーニ(J. C. Harsanyi) [2] の定式化によって分析できるようになった. たとえば, 利得関数u_i\, に関する情報が不完備な場合は, まず有限個のパラメターt_{i1}, t_{i2}, \ldots, t_{ik} \in T_i\, を導入し, プレイヤーi\, の利得関数は, そのタイプによって, 有限個の利得関数u_i(\cdot|t_{i1}), u_i(\cdot| t_{i2}), \ldots, u_i(\cdot| t_{ik})\, (以下, まとめてu_{i}(\cdot|t_{i})\, と表す. )のうちのどれか1つに定まる, と定式化し直すことにより, u_{i}\, に関する不完備情報を表現する. このt_i \in T_i\, をプレイヤーi\, のタイプという. 各プレイヤーi\, は自分はどのタイプであるかを知っているが, 他のプレイヤーのタイプは知らない. ただし, 他のすべてのプレイヤーのタイプt_{-i} = (t_1 , \ldots, t_{i-1}, t_{i+1}, \ldots , t_n )\, について条件付き確率p_i(t_{-i}|t_i)\, によってt_{-i}\, を推測することができるとする. こうして, 新たな戦略形ゲーム


G'= (N, S_1, \ldots , S_n;
                        p_1, \ldots , p_n; T_1, \ldots, T_n;
                        u_1(\cdot|t_1), \ldots , u_n(\cdot|t_n))\,


がえられる. これをベイジアンゲーム (Bayesian game) という. また, 関数s_i : T_i \rightarrow S_i\, をベイジアンゲームの戦略という. すなわち, プレイヤーi\, は, 自分のタイプを知ってはいるが, どのタイプであったとしてもそのもとでの行動を指定しておくことがこの場合の戦略である. するとナッシュ均衡は, すべてのプレイヤーi\, とタイプt_i\, およびa_{i} \in S_{i}\, について次の条件をみたす戦略の組s^*=(s^*_1, \ldots , s^*_n)\, である. この戦略の組を, ベイジアンナッシュ均衡 (Bayesian Nash equilibrium) という.


\sum_{t_{-i} \in T_{-i}} u_i(s^*(t)|t_i)p_i(t_{-i}|t_i) 
     \   \ge\   \sum_{t_{-i} \in T_{-i}} u_i(s^*_{-i}(t_{-i}), a_i
                        | t_i)p_i(t_{-i}|t_i)\,


ただし, s^*(t)=(s^*_{-i}(t_{-i}), s^*_i(t_i))=(s^*_1(t_1), \ldots, s^*_n(t_n))\, である. ベイジアンゲームは, 80年代以降, 情報経済学や産業組織論などの新しい分野の発展に大きく貢献している. これについてはたとえば, [1] を参照.



参考文献

[1] R. Gibbons, Game Theory for Applied Economists, Princeton University Press, 1992. /福岡正夫, 須田伸一, 『経済学のためのゲーム理論入門』, 創文社, 1995.

[2] J. C. Harsanyi, "Games with Incomplete Information Played by `Bayesian' Players, parts I, II and III", Management Science, 14 (1967-8), 159-182, 320-334, 486-502.

[3] M. J. Osborne and A. Rubinstein, A Course in Game Theory, MIT Press, 1994.

個人用ツール