スポンサーサイト
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
【--/--/-- --:-- 】
| スポンサー広告 | コメント(-) | トラックバック(-) |
仲介者による囚人のジレンマ解決法

「囚人のジレンマ」については聞いたことがあるだろう.

もし「囚人のジレンマ」や戦略形ゲームの表の読み方を知らなければ検索するといい.すぐ見つかるはずだ.たとえば三原麗珠「権利論への数理的アプローチ: レクチャー・ノート」のセクション 1.1.2 を参照.三原の例では数値がちがっているが,大小関係だけに注目すれば同じこと.

「囚人のジレンマ」とは以下の表のような戦略ゲームであり,相手が戦略 C (「協力」) を選ぼうと D (「非協力」) を選ぼうと,自分としては戦略 D を選んだ方が利得が高い.よってペア (D, D) が均衡 (支配戦略均衡) になる.その均衡からひとりだけが外れたところでそのひとの利得は上がらないので,もちろんこの均衡はナッシュ均衡でもある.問題は,均衡 (D, D) からふたりがそろって外れると協力のペア (C, C) が実現し,利得ペアが (1, 1) から (4, 4) へと,両者にとって改善することだ.「この協力時の利得 (4, 4) をうまく実現する方法はあるか?」という《ジレンマ解消》の問題はゲーム理論のひとつの関心事である.

C D
C (4, 4) (0, 6)
D (6, 0) (1, 1)

囚人のジレンマの解消法として有名なのは,無限回繰り返し (繰り返しゲーム) だろう.これは協力の繰り返しも均衡になるけど,その他「ほぼなんでも」均衡になることが知られている (フォーク定理).また「社会契約」などと呼ばれる,「強制装置の導入」による解決法も知られている.単なる強制では説得力がないので,ある強制装置に参加するとの協定あるいは契約を個人の自由意思にもとづいて結ぶと考えるのが普通だ.たとえば「非協力な行動をとったばあいは罰金を支払います」といった約束を考えることができる.こちらは個人がその約束どおりに行動するとはかぎらないという問題がある.

最近ボクが目にした Monderer and Tennenholtz (2006) による解消法は「仲介者」(mediator) を考えたものだ.上記の囚人のジレンマに仲介者を導入したゲームを以下にしめす (戦略 M の列と行が追加されている).読者は仲介者がどういう役割を果たしているか,その意味を考えると同時にこのゲームの均衡を求めるといい (演習問題).

M C D
M (4, 4) (6, 0) (1, 1)
C (0, 6) (4, 4) (0, 6)
D (1, 1) (6, 0) (1, 1)

時間稼ぎの蛇足.今回の記事に唐突に囚人のジレンマを持ち出したことに深い意味はない.我田引水のためのなにかの伏線と思う読者もいるだろうが,いまのところ種明かしのようなものは考えていない.囚人のジレンマはそれ自体有名だから,その解消法に関心を持つ読者は少なくないだろうという判断だ.

さて「演習問題」を少しは考えてくれただろうか? 答の解説に進もう.

まず (D, D) は以前と同じくナッシュ均衡になっており,(1, 1) の利得を実現する.そのほかに (M, M) もナッシュ均衡になっており,利得 (4, 4) を実現することがわかる.で,(M, M) の強みはそれが「強均衡」と呼ばれる均衡になっていることだ.これはその戦略の組合せから (ひとりとはかぎらない) 何人かのひとびとが戦略を変えたところで,彼らすべての利得が改善することはないような戦略ペアのことである.つまり,(M, M) を離れてたとえばふたりが (D, C) にうつれば利得は (4, 4) から (6, 0) と変わるが,ひとりの利得は下がっている.ほかにどこに移ろうとも,両者の利得が同時に改善することはない.一方で,もうひとつのナッシュ均衡 (D, D) からはふたりが (C, C) なり (M, M) なりにうつれば両方の利得が上がる.つまり (D, D) は強均衡ではない.「強均衡」という概念に絞り込めば,(M, M) だけが該当するわけであり,囚人のジレンマの解消になっている. (もとのゲーム自体のではなく,仲介者を導入したゲームの強均衡なので "strong mediated equilibrium"と彼らはよぶ.)

問題は上の拡張したゲームの意味だ.これは仲介者がプレーヤーたちに以下の提案をすると理解すればいい:「もし両方のプレーヤーが自分を仲介者として利用することに同意してくれれば,自分はそれぞれのプレーヤーに代わって C をプレイする.もしひとりだけが自分を仲介者として利用することに同意してくれれば,自分はそのプレーヤーに代わって D をプレイする.」すなわち戦略 M は仲介者の利用に同意することと考えれば,上のゲームが出来上がる.もちろん仲介者を利用しない自由はプレーヤーに確保されている.(ただ,他人による「代理プレイ」が効くような戦略でないとこの解決は無理だろう.)

以上紹介した Monderer and Tennenholtz (2006) による解消法と似た方法として,現在ではほとんど忘れられてしまった「メタゲーム」による解消法というのがある (たしか彼らは言及していない).ゲーム理論の専門家でも若い世代は知らないかもしれない.したがって自分もほとんど知らないわけであるが,これはたしか自分の戦略を相手の戦略に依存させ,たとえば「キミが協力するならボクも協力,キミが非協力ならボクも非協力」といった戦略を考えたと思う.ここで問題になるのは,もとの囚人のジレンマが互いに相手の戦略を見ずに自分の戦略を決めるという,「同時決定」のゲームであったことだ.「メタゲーム」の類いの戦略の依存性を持ち出すとどうしても暗黙的に「時間」の要素が入ってきて「同時決定」から離れることになるんではないか.ゲームを拡張しているわけなので時間が入ること自体はまちがいではない (繰り返しゲームでも時間が入るし) が, できれば同時決定の設定は変えずにジレンマを解消したいものだ. (←若輩ゆえこの段落はまともな知識や資料なしで議論しているのであまり信用しないほうがいい.)

蛇足.メタゲームはほとんど忘れられてしまったというのは経済学にかんするかぎりウソではないが,死滅したわけではない.わが平成香川大学の経済学部は10年ほど前に「コンフリクト解析」の分野で理論家を公募して採用したことがある.その分野こそがメタゲーム理論の別名 (あるいは発展形?) である.経済学部の採用は特定の候補者を想定しているわけでもないのに,しばしばかなり (きわめて?) マイナーな分野というか,ひじょうに限定された分野を指定することがあった.たとえば「社会学」ならず「社会ネットワーク分析」で公募したりした.(近年ポピュラーになってきているとはいえ,日本語の分かる「社会ネットワーク分析」専門家がいったい何人いるんだ?) こちらは古いというよりは新しすぎてマイナーな例かもしれない.

さいわい Monderer and Tennenholtz (2006) の解消法は同時決定ゲームから外れるものではないと思う.仲介者は提供するサービスをそれぞれのプレーヤーが利用してくれたかどうかを知ったうえで行動することから時間は暗黙的には入っているといえるかもしれない.しかしふたりのプレーヤーに注目すれば,べつに相手が仲介サービスを利用しているかどうかを確認した上でこちらの戦略を決めているわけではないため,同時決定のゲームと考えてよいだろう.また,「仲介者」といっても「仲裁」とか「調停」のような積極的なことをするわけではない.まったく受動的に行動するだけの「媒介」にすぎないコンピュータープログラムだったりするわけだから,「仲介者」をプレーヤーから外すことも正当化できるだろう.

以上のように考えると「新しい」解消法と言えると思うんだが,なんかなじみがあるような気がして仕方ない.

参考文献. Dov Monderer and Moshe Tennenholtz. Strong mediated equilibrium. In Proceedings of AAAI 6, 2006.

スポンサーサイト
【2007/06/18 01:54 】
| 社会科学 | コメント(0) | トラックバック(1) |
| ホーム |
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。