スポンサーサイト
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
【--/--/-- --:-- 】
| スポンサー広告 | コメント(-) | トラックバック(-) |
非循環性なしの社会選択理論---その後
非循環性なしの社会選択理論が出現!」で紹介した論文がジャーナルにアクセプトされたようだ:
Masahiro Kumabe and H. Reiju Mihara (2010). Preference aggregation theory without acyclicity: The core without majority dissatisfaction. Games and Economic Behavior (2010), doi:10.1016/j.geb.2010.06.008. (MPRA paper としても入手可)

以下は著者のひとり三原麗珠からのメッセージである:


以前書いた「非循環性なしの社会選択理論が出現!」という寄稿では,
「『[非循環性なしの社会選択理論を提示したことが] すごいことなの?』って? 経済理論を教える大学教授にでも聞いてくれ.」
と書いたが,今回ゲラ刷りをチェックしていて,我ながら「すごいな」「よくこんなラディカルなことをやったな」と思った.といっても以前書いた論文を読み返すと,「すごいな」「よくこんな難しいことができたな」「神がかっていたみたいだ」などと思うのは毎度のことなので,参考にはならない.

今回ボクにとってよかったのは,はじめてゲーム理論プロパーのジャーナルである GEB に掲載が決定したことだ.ゲーム理論を学生に教えて来た身としては,ゲーム理論のジャーナルに論文が掲載されたことがないというのは (特に問題ではないものの) あまりうれしい状態とは言えなかった.たしかにトップクラスの経済学ジャーナルはカバー範囲が広くて,タイトルにもフィールド名なしに "Economics" とだけあるものが多い.しかし「ゲーム理論」とか「社会選択」といったフィールド名のあるジャーナルは,愛着というか帰属意識というか土着性というか,そういうものを感じやすいのだ.ゲーム理論という「土着性」を感じられる場で,いつか自分の論文を発表してみたかった.思考がローカルな人間なのかもしれない.

これでボクも自信を持ってゲーム理論家を名乗っていいかな?」と思わなくもないが,たぶん「ダメだ!」と言いたいゲーム理論家もいるだろう.じっさい上記論文は,ボク自身がもっとも正統なゲーム理論とみなしている非協力ゲーム理論とはあまり関係ない.協力ゲーム理論とは不可分ではあるけど,ほぼまちがいなく社会選択理論の論文である.そう,そういう社会選択の論文をゲーム理論のジャーナルに載せたことこそが,隣人の領域を侵犯したような,これまでにない心地よい感覚を与えてくれているのだ.

男子トイレの臭さに我慢できなくて,女子トイレを使ったときのような感覚……いやちがうな,我慢できなかったわけじゃないから.器械体操が (昔は) 得意だったボクが,(女子の種目である) 段違い平行棒で入賞したような感覚……これもちがうな,自分の普段やる種目で競技したわけだから.べつに男湯に不満はないが,たまには女湯にでも入ってみようと入ってみて,なんの文句も言われずに上がって来れたような感覚か.とか言うと,「そんなにすごいのか?」と言われそう.笑
【2010/07/17 16:53 】
| 社会科学 | コメント(2) | トラックバック(0) |
ナッシュ均衡のリファインメントを研究したいという大学院生への助言
ナッシュ均衡のリファインメント (精緻化) を研究したいって? やめた方がいいよ.少なくとも本物のゲーム理論家の指導なしにはやらない方がいい.これは社会選択理論じゃないんだ.個人主義と集団主義を区別できずに取り組むテーマじゃないんだよ.自分が提示するリファインメントを正当化するためには,哲学的議論も必要だよ.それだけの英語力ある? いまの時代なら行動経済学とかニューロエコノミクスへの言及くらいはいるんじゃないかな.調べる気あるの? 「社会選択でも倫理学的・哲学的議論をするから同じだ」って? いや,非協力ゲーム理論のばあい (社会) 倫理学的議論を混ぜてはいけないんだよ.あくまでも個人の合理性にもとづく正当化だけが許される.「なぜ?」って? むずかしいこと聞くなあ.そんなこと本物のゲーム理論家に聞いてくれ.たぶん習慣じゃないのか (笑),経済学って事実解明的 (記述的・実証的) でもあり規範的でもあるでしょ.個々の理論を考えるときは,その区別をはっきりさせた方がいいってことじゃないかな.

かならずしも事実解明的理論と規範的理論を区別することには対応しないけど,とりあえず個人の合理的行動を基準にして均衡を絞るときは,(その基準や絞った結果の均衡概念を) refinement と呼び,それ以外の (と括っていいか分からないが,とりあえず「焦点」になりそうな) 均衡を選ぶ基準は selection criterion と呼ぶみたいだ.ほら,Myerson も refinement と selection を区別してるぞと yyasuda の英語ブログに載ってるじゃん.後者の基準では集団の合理性に基づいて均衡を絞ることも許されるけれど,その絞った結果を「均衡概念」と呼ぶことはほとんどない.

Refinement と selection は数学的には区別できないグルーピングだけど,個人の合理性でなんでも説明しようという経済学としては重要な区別だ.異なる概念 (グループ) には異なる用語を意図的に用いるのは,思考の混乱を避けるためにも重要だということでしょう.

もひとつ付け加えておくと,「社会選択でも倫理学的・哲学的議論をするから同じ」と言っても,むずかしさが同じじゃないのは分かるよね? いや,べつに社会選択の方がやさしいという意味じゃなくて.というのは,非協力ゲームの均衡概念にせよリファインメントにせよ (←べつに区別してるわけじゃない),すでにかなりの研究が蓄積されたテーマなんだよ.いまさら説得的な均衡概念を提示するのはとてもむずかしそうにボクには思えるよ.


それでもリファインメントをやりたいというキミのために,これまでに提示されたリファインメントを分類しておこう.主に2つのタイプがある:
  1. ちょっとしたミスなどを表す perturbations (摂動) を導入するもの. これは不合理を象徴するノイズをだんだん少なくしていった極限に合理性を見るアプローチとでも言えるかしらん.
  2. 弱支配された均衡を順次取り除くなどの行動理論的な基準を直接課すもの.均衡概念を公理的に特徴づけることをたぶん目標としている.
だいぶ省略した感はあるけど,以上でリファインメントのサーベイはおしまい (笑).で,キミが言う「他の均衡よりパレート劣位な均衡は削除できるはず」というのは上記でいえば2番目の,基準を直接課すものに該当しそうだが,そもそもリファインメントとは言わない.(「強均衡」を知っている人は同意しないかも.) 集団の合理性にもとづく基準であっても,個人の合理性にもとづく基準ではないからだ.だからその基準を直接要請するのではなく,個人レベルのべつの基準の帰結として導くしかないと思う.信じないなら本物のゲーム理論家に聞いたらいいけど,ボクにはそれはとてもむずかしそうに思える.

たとえば次のコーディネーションゲームを見てみよう.2人のプレーヤーの利得がともに
f(a,a) = 1, f(a,b) = f(b,a) = 0, f(b,b)=2
で与えられるゲームを考える.「プレーヤー2 は戦略 a を選ぶ」とプレーヤー1 が予想しているかぎり,プレーヤー1 にとっては戦略 a を選ぶのがベスト.その場合利得は 1 だけど,かりに戦略 b を選ぶと利得は 0 になってしまう.プレーヤー2についても同様なら,けっきょく (a, a) という「悪い」ナッシュ均衡が実現して利得列は (1, 1) となる.

ところがキミは利得が (2, 2) である「良い」ナッシュ均衡 (b, b) が実現するはずだと言う.規範的な意味で「そうすべき」と言っているなら分かるが,「実現するはず」と予想するような言い回しをしている以上,事実解明的な理論として均衡概念を考えているんじゃないか.だとすると「「悪い」均衡 (a, a) が選ばれるはずはない」という予想が外れているケースが多いことさえ理解できれば,その基準,さかのぼれば「他の均衡にたいしてパレート劣位な均衡は削除できる」という基準は,事実解明理論としてはダメだということが分かるはずだよね.そういうケースは一般向けのゲーム理論の本にもいろいろ載ってるのでいちいち挙げないけど,たとえば川西諭『ゲーム理論の思考法』でも見ておいて.

ここでは「プレーヤー2 は戦略 a を選ぶ」といった予想を変えるのは通常はひじょうに困難であることを指摘しておく.まず気をつけるべきは,ゲームというのはなにもない白紙のとろに突如現れてプレイされるわけではない.タブララーサも無知のベールもそこにはないんだ.社会現象を表現したものがゲームである以上,通常はすでにプレーヤーもいるはずだし,これまでの経緯とか歴史とか文化というものもあるはずだ.「それらすべてを完全に記述してはじめて,その状況を表現するゲームと言える」という批判は正当と言えるが,その要請をつねに満たすのは無理だと思う.

そういう過去とか文化とかあるわけだから,プレーヤーにとってすべての戦略が「等距離」にあるということはなくて,いずれかの戦略が現状に近いのが普通だ.上のコーディネーションゲームで,たとえば戦略 a が既存の (劣った) テクノロジーで b が新規テクノロジーだとする.たとえば a はある組織で採用して来た中途半端な (各部署に閉じたような) グループウエアの利用で,b は Google Apps の利用,そしてプレーヤは組織の各部署としてもいいかもしれない.各部署とも b を採用したらいいことは分かっていても,社長からの号令でもないかぎり,相手がそれを採用してくれると予想する根拠は一般にはない.特にいま考えているのがコーディネーターとかコミュニケーションを想定しない同時ゲームであることを真に受ければ,ますます根拠がなくなる.ということで互いに (a, a) に留まる均衡から抜け出せない.

人数が多いゲームならますます現状維持の傾向は強くなるだろう.多人数のなかで数人が新しい技術を採用しても,採用した者が大きく損して,採用しなかった者がちょっとだけ損するような状況を考えればいい.ネットワーク外部性があるような分野では,優れた技術がなかなか普及せず,単に多数派であるという理由だけで多数派が支配することは多い.

そもそも悪い均衡から抜け出すことがそんなに簡単なら,いろんな組織に存在するしょうがない慣習もすぐに変えられるはずだ.しかし個人の立場で現状を変えることがどれだけ大変なことかは,ボクのように無駄な努力を費やして苦しんできたひとでなくても分かるはずだ.みんなで変えればみんなが得するはずなのに,だれも変えようとしないことが多すぎる.

もう一度いえば,単に全員にとって悪いからというだけでは,ある均衡を排除する根拠として十分でない.個人レベルで排除できないものを排除できると考えることは思考に飛躍がある.均衡の「リファインメント」を提示するときは,その飛躍を議論に持ち込まないように注意する必要がある.もちろん均衡からの「セレクション」としては,社会選択や協力ゲームの流儀で全員にとっての倫理的基準を持ち込むことはできる.しかしそういう基準はあくまでも望ましさを表す規範的基準であり,行動を予想するという意味での記述的基準とは区別しなければならない.

追記 (6/5/2010)

ケン・ビンモアの『1冊でわかる ゲーム理論』(2010) という風変わりな入門書に,この記事の主張を駄目押しする記述を発見:
  • 「ゲーム理論の歴史の中で,この精緻化の段階は事実上終わっている」(70頁)
  • 「人生というゲームを行なうプレイヤーは,『みんな』などという抽象的な存在ではない.われわれは皆,独立した個人であり,それぞれの意図や目的を持っている」(86頁)

(社会選択などを専門とする HRM からの寄稿)
【2010/06/04 14:36 】
| 社会科学 | コメント(0) | トラックバック(0) |
投票方式はこれで決まり?
決定版になるかもしれない投票方式が発表された (といっても最新情報ではない).発表したのは選挙システムの改革に熱心な数学者とも政治学者とも経済学者ともいえる Michel Balinski らだ.発表媒体は経済学者がほとんど投稿しない PNAS という米国雑誌である:
Michel Balinski and Rida Laraki, 2007, A theory of measuring, electing, and ranking. Proceedings of the National Academy of Sciences of the United States of America, 104: 8720-8725.

社会選択理論でもっとも標準的なのは,「選好」にもとづくアプローチである.アローの定理に始まる不可能性定理に満ちたこのアプローチからの訣別を目指す著者らの意気込みは,アロー以前の忘れられた古典からの「文学的」とも思える頻繁な引用からも伺える.Google Scholar によれば,この論文は現在のところ 37 件のソースに引用されている.爆発的とは言えないデビューだが,こんご静かに支持を増やして行くかもしれない.(あまり比較にならないが,HRM の 1997 年のある論文の被引用数 34件 はすでに越えている.)

Balinski らが提唱する方法は,基本的には各人が候補者 (選択肢) に割り当てるゲレードの中央値をその候補者の最終グレード (アウトプット) とする方法である.その興味深い同点決戦ルール (tie-breaking rule) を除けば,すでにじっさいに利用されているはずだ.

簡単な例を見てみよう.候補者 2人,投票者 6人がいて,各投票者は6段階あるグレード A, B, C, D, E, F (好ましい順) のいずれかを各候補者に割り当てるとする.いま,候補者 1 が A, E, C, E, A, C を,候補者 2 が B, E, E, C, A, B を獲得したとする.高い順にグレードを並べ変えると,
  • 候補者 1: AACCEE
  • 候補者 2: ABBCEE
となる.両候補者の獲得グレードの中央値は C となる.(候補者 2 は B および C が中央値だが,ここでは悪い方を取る.) いまのように同点のばあいには,各人のグレードのリストからこの中央値 C をひとつ分抜いたリストを考える:
  • 候補者 1: AACEE
  • 候補者 2: ABBEE
すると今回は候補者1の獲得グレードの中央値が C, 候補者 2 のそれが B となり,これらが最終グレードとなる.したがって候補者 2 が候補者 1 より高いランクを得る.

リマーク.ここでは中央値の一回の削除で最終グレードが得られたが,より一般的には異なる最終グレードが得られるまで中央値の削除を繰り返すことになる.二人の候補者が得た整列後のグレード行が同一でない限り,その優劣は決められる.


さて,この投票方式の背後には,method of grading (格付け方法) および aggregation function (集計関数) と呼ばれる関数が存在する.

まず,Method of grading とはどんな関数か? そのインプットは,プロファイルと呼ばれるグレードの行列で,i 行 j 列の値は候補者 i にたいする投票者 j のつけたグレードを意味する.アウトプットは,各候補者に1個ずつ割り当てられた最終グレードからなる列である.

ここでカギになるのが IIA (independent of irrelevant alternatives; 無関係対象からの独立) という公理であり,これはある候補者がふたつのプロファイルのいずれにおいても同じグレード行を割り当てられたら,この候補者はどちらのプロファイルでも同じ最終グレードを得るという要請である.つまり特定の候補者の最終グレードを決めるのに他の候補者の得たグレードは関係ないということである.(候補者 2人の順序を決めるとき,その2人にたいする順序付けだけが問題になるとしたアローの定理における IIA とちがい,ここでは候補者 1 人のグレードを決めることを問題にしている.)

したがって,もし method of grading が IIA をみたせば,その背後には「獲得グレードのリスト (行) をインプットとし,1個の最終グレードをアウトプットとする関数」が存在することが分かる.これを aggregation function と呼ぶ.Method of grading で特定の候補者の最終グレードを決めるためには,プロファイルからその候補者にかかわる行だけを取り出し,それを aggregation function に入れればよい.ただし各候補者に異なる aggregation functions が適用される可能性は残るので,それを避けるためには公理 neutrality (中立性; 候補者を平等にあつかう要請) を method of grading に要求すればいい.

Aggregation functions の例としては,グレードのリストの
  • 平均にいちばん近いものを最終グレードとするもの,
  • k 番目に高い値を最終グレードとするもの (kth-order functions)
などが考えられる.ここで「戦略的操作」の可能性を考えると,項目 2 の kth-order functions が残り,「平均」ははじかれる.さらに社会厚生の最大化や多数による支持なども考慮すると,(項目2 の特殊ケースである) 中央値を最終グレードとする方法が生き残る.Balinski らがグレードの中央値を採用したゆえんだ.

リマーク.中央値が多数の支持を受けるというのは,中央値にあたるグレード m とそれ以外のグレード g を比較すると, m が多数を得るということだ.かりに g が m よりも高かったら,m 以下のグレードをつけたひとはすべて m を g より支持するはずで,その人数は (m が中央値であることから) 半数以上となる.

じつは平均にせよ,kth-order functions にせよ,aggregation functions と呼ばれる関数はすべて定義により anonymity (匿名性), unanimity (全員一致の条件), monotonicity (単調性) の公理を満たす.それに連動して method of grading 自体も対応する公理を満たす.つまり何らかの aggregation function にもとづく method of grading というだけで,すでにかなり望ましい性質を持った関数になっている.

リマーク.ここで anonymity (匿名性) とは投票者を平等にあつかうことを要請する公理だ.上記の例で候補者 1 が得た A, E, C, E, A, C のグレードをAACCEEと整列して考えた.これは「どの投票者がどのグレードを割り当てたか」ではなく,「各グレードがどれだけの頻度で現れたか」だけが問題になるためだ.つまり中央値にもとづく method of grading が anonymity を満たすことを利用した.

また,monotonicity (単調性) という公理は,ある候補者にたいして,すべての投票者がプロファイル 1 においてプロファイル 2 におけるより高いグレードを与えるとき,その候補者が得る最終グレードはプロファイル 1 においてプロファイル 2 におけるより高くなることを method of grading に要請する.(また,すべての投票者がプロファイル 1 においてプロファイル 2 以上のグレードを与えるとき,その候補者が得る最終グレードはプロファイル 1 においてプロファイル 2 以上になることを要請する.)

Method of grading ならではの要請とボクが見なしているのは unanimity (全員一致の条件) である.これは「ある候補者に全員が同じグレード g を与えたら,この候補者の最終グレードは g になる」ことを要請する.これは「秀」とか「優」とか「良」といった各グレードの意味が「共通の言語」(common language) としてはっきりシェアされている場合にこそ有意義に要請できる公理だと思う.

リマーク.通常のアローのフレームワークのように選好をインプットとするばあいは,この意味における unanimity を要請すべきかどうか疑わしい.ある候補者をすべての投票者が選好の 3 番目に位置づけているとしても,たとえばある投票者はグレード B くらいを与えたいと思っていて,べつの投票者はグレード E だと思っているようなばあい,最終ランキング (社会的選好) でその候補者を 3 番目にする必要があるかどうかは疑わしい.

さて,Balinski と Laraki が提唱するこの投票方法にみなさんはどう反応するだろうか?
「うちの大学で採用している決め方で,〈平均〉のかわりに〈中央値〉を使えばこれになる」
と言う大学関係者もいるかもしれない.
「社会選択理論ではすべての選択肢にたいする選好 (順序付け) を投票者が表明することは知っていたが,じっさいには選好のすべてを表明するようなルールは稀だ.ひとびとは選択肢全部をランク付けするよりは,各選択肢にグレードを与える方が楽なのではないか.10人も面接したら自分も記憶が交錯してランク付けなんかできなくなるけど,グレード付けならひとりづつやれるのでなんとかできそうだ」
と思う面接官経験者もいるかもしれない.

(投票理論などを専門とする HRM からの寄稿.投票理論家として保持するどうでもいい「記録」がプロフィールにある.)
【2010/05/20 17:08 】
| 社会科学 | コメント(5) | トラックバック(0) |
ナッシュ遂行では顕示原理は成り立たない

この記事は,ある問題にかんするある研究者との理解の不一致に端を発した覚え書きである.目的はボクの理解するところを伝達すること.用語の説明はかなり省略する.対象読者はメカニズム・デザインに触れたことがあるひと.まずは簡単に用語を復習しておく:

  • 社会選択対応とは選好列 (選好プロファイル) にアウトカム集合を対応させる対応.
  • メカニズム (ゲームフォーム) とはメッセージ (アクション) 列にアウトカムを対応させる関数.
  • 直接メカニズムとは各人のメッセージが自分のタイプ (選好) であるようなメカニズム.社会選択関数 (一価である社会選択対応) のこと.[追記.本稿の結果はこの定義に決定的に依存する.最後の「追記」を参照.]
  • 「メカニズムが社会選択対応を遂行する」とは,つねにそのメカニズムによる均衡アウトカム集合がその社会選択対応で選ばれるアウトカム集合と一致すること.
  • 「直接メカニズムが社会選択対応を正直遂行する」とは,つねに自分のタイプ (選好) を正直に申告する戦略列がそのメカニズムの均衡になり,かつ均衡アウトカムが社会選択対応で選ばれるアウトカム集合にふくまれること.(正直戦略以外の均衡アウトカムが社会選択アウトカムになっているかどうかは関係ない.)

顕示原理とは「ある均衡概念のもとで,あるメカニズムがある社会選択対応を遂行するとき, (その社会選択対応の selection である) ある直接メカニズムがその社会選択対応を正直遂行する」という命題である.この原理は均衡概念が支配戦略均衡あるいはベイジアン・ナッシュ均衡のもとで成り立つことが知られている.

ではナッシュ均衡のもとでは顕示原理は成り立つか? テキストなどではなぜかあまり触れられない疑問だが,ボクは成り立たないと思っている.しかし成り立つと信じているひとは意外に多いかもしれない.ここではどうしてそういう誤解が生じたのか (ベイジアン・ナッシュ均衡は完備情報化ではナッシュ均衡になるから?) は気にせずに,成り立たない理由を説明してみる.間違っていたら教えて.

ボク自身が成り立たないと思ったきっかけは,自分が証明に行き詰まったからだ (笑).たとえばベイジアン・ナッシュ均衡による遂行にかんする顕示原理の証明 (e.g., MWG, Prop 23.D.1) を辿ってナッシュ均衡による遂行の場合を証明しようとすると行き詰まる.その原因は以下の違いに起因する:

  • (ベイジアン・ナッシュ均衡を通常考える) 不完備情報での戦略とは,自分のタイプからアクションへの関数である (各自 i は自分のタイプθiのみ知ってアクション sii) を選ぶ)
  • (ナッシュ均衡を通常考る) 完備情報での戦略とは,タイプのプロファイルからアクションへの関数である (各自 i は全員のタイプθを知ってアクション si(θ) を選ぶ; MWG Chapter 23, Appendix B 参照)

より具体的に言えば,証明の最後近くで詰まるはず.g(si(θ'), s-i(θ)) のような形が出て来てきれいに分離できない.(もとの証明では g(si(θ'i), s-i-i)) となるところ.) つまり "Tell me your type" の部分で自分以外のタイプも申告してしまうわけだ.

もちろんボクが証明できないというだけではある命題が偽であることにはならない (←当然だよなあ).したがって反例を挙げることにする.(じつは反例を考えた記憶がない.指摘してくれた方に感謝.) これで「成り立つ派」も納得では?: 間接メカニズムである Walker メカニズムは Lindahl ルールをナッシュ遂行する.しかし Lindahl ルールにおいては正直に選好を申告することはナッシュ均衡にならない.したがってナッシュ遂行では顕示原理は成り立たない.納得してもらえたかな?

おまけ 1. 「正直遂行」が「遂行」の特殊ケースになっていないことに注意すれば,一般には顕示原理の逆は成立しないことが分かる.つまり「ある直接メカニズムがある社会選択対応を正直遂行するとき,あるメカニズムがその社会選択対応を遂行する」という (字面からは当然そうな) 主張は成り立たない.ところがこれが成り立つという誤解は少なくないようで,しばしば不適切な場面で「分析を直接メカニズムに限定してよい」という記述が見られる.(MWGや契約理論のテキストではメカニズムの均衡アウトカムのなかに社会選択対応で選ばれるものが入っていることをもって「遂行」としていることが多い.この場合,顕示原理の逆は当然成り立つので,分析を直接メカニズムに限定するのは問題はない.問題なのは「遂行」の意味が本文でしめしたものと同じであるにもかかわらず顕示原理の逆が成立すると想定してしまう場合である.)

おまけ 2. 実はまだゆっくり見てないのだが,Behavioral Mechanism Design Bibliography Database というサイトが便利らしい.

おまけ 3. メカニズムデザインにかんする入門記事としては,「ソロモン王のジレンマはセカンドプライス・オークションで解決できるじゃないか!」をすすめるが,専門用語を避けているためこの記事の理解のためには不十分である.この記事の理解のためには,三原麗珠の「メカニズム・デザイン: レクチャー・ノート」レベルの知識は欲しいところ.

追記 (10/24/2009). Osborne and Rubinstein (1994) によればナッシュ遂行では顕示原理は成り立つという! 「平凡助教授まちがってるじゃん!」って?---そうではなさそうだ.どうしてこういう違いが起きたかと言えば,彼らの正直遂行の定義 (Definition 179.2) では,ここでいう直接メカニズムに当たるゲームフォームで人々は (自分のタイプに代わって) 全員のタイプを申告することになっているためである.どうやら顕示原理も定義の微妙な違いによって成立したりしなかったりするようだ!

(HRM からの寄稿)

【2009/10/23 22:43 】
| 社会科学 | コメント(0) | トラックバック(0) |
囚人のジレンマの作り方

「囚人のジレンマ」については聞いたことがあるだろう.ゲーム理論ではもっとも有名なゲームだ (実際はあまり「ゲーム的状況」になっていないのだが).このブログでも「仲介者による囚人のジレンマ解決法」という記事であつかったことがある.

最近,自分で作った演習問題 (正誤問題) を見ていてふと気づいたことがある.

「ナッシュ均衡から同時に二人が離れる (戦略を変える) ことによって,その二人の利得が両方とも改善されることはない」というステートメントの真偽を尋ねる問題だ.正解は「偽」で,囚人のジレンマを反例としてあげればよい.

囚人のジレンマを反例としてあげてくれればその問題の正解にはなる.その問題の場合ほかにももっと簡単な反例はあるが,問題によっては囚人のジレンマくらいしか思いつかないものもあるだろう.そういう問題ではしばしば「囚人のジレンマ」と答えるだけでは不十分で,出題者は利得行列を要求することが多い.すると「囚人のジレンマの利得は暗記しないといけないのか? あの数字はどうやって思いつくんだ? 手品じゃないんだから種明かしくらいして欲しい」という学生が現れるかもしれない.「ゲーム理論家は賢いからそんな数字はすぐ思いつく.ゲーム理論をマスターできるような学生にとってもそんなことは十分簡単なはずだから,その数字をどうやって思いついたかなんてことはどのテキストにも載ってないよ」と突き放せばいいのかもしれない.じっさい,作り方なんて載せてるテキストを見た記憶がない.だが,そうすると本気で囚人のジレンマの利得表を丸暗記しようとする学生が出て来るかもしれない.それは教育的にはあまり望ましい状況とは言えないので,以下に作り方を解説してみる.

リマーク.こういう天から突然与えられたような例は数学や経済理論をやっているとしばしば遭遇する.たとえば社会選択では多数決で選択肢 a が b に勝ち,b が c に勝ち,c が a に勝つようなサイクルを与えるような選好の組が突然出て来る (たとえば投票者 1 は abc の順に選好,2 は bca の順,3 は cab の順).その作り方はまず説明されない.

簡単なので説明しておこう.要するに a→b→c→a のサイクルを最初に考えて,1の選好はこのサイクルのc→a 部分をぶった切ったもの,2の選好は a→b 部分をぶった切ったもの,3の選好はb→c部分をぶった切ったものとすればいい.図式は三原麗珠のアローの定理解説ビデオの 2:59 あたりからの解説にある.(同ビデオのスライドの pdf は香川大学学術情報リポジトリにある.)

まず,(もっとも簡単な) 囚人のジレンマは2人ゲームで (プレーヤーは Player 1, Player 2 とする),プレーヤーはそれぞれ戦略を2個持つことくらいは覚えておこう (Player 1 の戦略は U, D で,Player 2 の戦略は L, R としておく).そうすると戦略の組は4つしかない.したがって利得表を埋めるための数字としてはたとえば 0, 1, 2, 3 の4個を用意しておけば十分である.

詳細.まず,Player 1 が順序付けすべき対象は,4つの戦略ペアだけである.混合戦略を考えないという前提では,利得の意味するものはその大小関係にすぎない.したがって(1, 2, 2.1, 2.101) なんていう4つの数字を (0, 1, 2, 3) と言い換えたところで問題はない.同様に Player 2 の利得を表すにも 4 つの数字で十分だ.読者は 「Player 2 は Player 1 の 10 倍感じる」ということを表現しようとしてPlayer 2 の利得に使う数字を (0, 10, 20, 30) としたいかもしれないが,これも (0, 1, 2, 3) と言い換えられる.つまり非協力ゲーム理論では通常は「Player 2 は Player 1 の 10 倍感じる」なんて個人間比較は意味がないものとされる.じっさい非協力ゲーム理論のまともな解 (均衡概念) をみれば分かるように,異なる戦略ペアにたいする特定のプレーヤの利得の比較はするが,異なるプレーヤー同士の利得は比較しない.(均衡の定義で左辺に i の利得が,右辺に j の利得があるような式は現れないはずだ.)

あとは囚人のジレンマの (i) ストーリーあるいは (ii) 特徴のいずれかを覚えておけばよい.

囚人のジレンマの作り方 1

囚人のジレンマのストーリーを覚えておく.そうすると 4 つある戦略ペアをどういう順番でそれぞれの囚人が順序づけるかは分かるはずだ.利得の低い方から 0, 1, 2, 3 の値を当てはめればできあがり.

囚人のジレンマの作り方 2

この作り方では 0, 1, 2, 3 から利得を当てはまる必要はない.囚人のジレンマの特徴として以下を覚えておく (最後2つの特徴は本質的ではないので,作り方 3 では外す):

  • 各プレーヤーは (強い) 支配戦略を持つ.
  • (均衡である) 支配戦略の組に対応する利得ペアよりも両者にとって望ましい利得ペアがある.後者の利得ペアに対応する戦略ペアはとうぜんナッシュ均衡ではない.
  • 均衡での利得ペアは (u, u) のように両プレーヤーの利得が等しいものになっている.また前項で言う,均衡におけるものより望ましい利得ペアは (u', u') のように両プレーヤーの利得が等しいものになっている.
  • 利得ペア (u, u) は利得表の右下,(u', u') は左上に現れる.

2.1. 均衡における利得ペア (u, u) を適当に決め,u' = u + 1 とする.仮に (u, u) = (1, 1) とすると,(u', u')=(2, 2) になる.

2.2. この段階で利得表は以下までできている.

L R
U (2, 2) (?, ?)
D (?, ?) (1, 1)

あとは,D と R が支配戦略になるように表を埋めれば以下のようになる.ここでは戦略を切り替えたときの利得の差が 1 になるように揃えた.

L R
U (2, 2) (1-1, 2+1)
D (2+1, 1-1) (1, 1)

つまり,

L R
U (2, 2) (0, 3)
D (3, 0) (1, 1)

補足2.1. もし利得を 0, 1, 2, 3 から選ぶならば, (u, u) = (1, 1),そして (u', u') = (2, 2) となる.

  • (u, u)=(0, 0) にはならない.もし (0, 0) であれば,(可能な利得が 0, 1, 2, 3 と,すべて 0 以上であるため),D や R が支配戦略であることに反する.
  • 一方,(u', u')=(3, 3) にはならない.もし (3, 3) であれば,(可能な利得が 0, 1, 2, 3 と,すべて 3 以下であるため) (3, 3) に対応する戦略ペアがナッシュ均衡になってしまう.
  • 以上より,0< u < u' < 3 であるから,u = 1, u' = 2 となる.

補足 2.2. 利得ペア (u, u)=(1, 1) を利得表の右下にすれば,利得ペア (u', u') = (2, 2) の位置は左上になる.

もし (u', u') = (2, 2) を以下の図のように右上に持って来ると,D が支配戦略であることに反する.

L R
U (?, ?) (2, 2)
D (?, ?) (1, 1)

同様に, (u', u') = (2, 2) を左下に持って来ると,R が支配戦略であることに反す.

囚人のジレンマの作り方 3

「囚人のジレンマの作り方 2」で挙げた囚人のジレンマの特徴のうち,最初の2つを使う.各プレーヤーの利得には 0, 1, 2, 3 の数をすべて使うことにする.

3.1. Player 1 の利得を以下のように割り当てる.この割り当ては覚えておいた方がいい (補足 3.2).

L R
U (0, ?) (2, ?)
D (1, ?) (3, ?)

3.2. D が支配戦略になっていることに注意すると L が支配戦略になることが分かる.(詳細.もし,R が支配戦略ならば (D, R) が支配戦略の組となるが,Player 1 の利得が 3 なので,これより改善できないことになる.)

3.3. Player 2 の (D, L) における利得は 0 あるいは 3 にはならないことに注意する.(詳細.この利得が 0 ならば,L は支配戦略にならない.この利得が 3 ならば, (D, L) が支配戦略の組となるが,Player 2 の利得が 3 なので,これより改善できないことになる.)

もし Player 2 の(D, L) における利得が 1 ならば,利得表は以下の通りに決まり,これは囚人のジレンマになる.(均衡を右下に持って来たければ,L の列と R の列を入れ替えればよい.シンメトリックな利得行列が得られる.)

L R
U (0, 3) (2, 2)
D (1, 1) (3, 0)

補足 3.1. 3.3でもし Player 2 の(D, L) における利得が 2 ならば,利得表は以下のようになり (ただし (x,y)=(0, 1) or (1, 0)), 均衡 (D, L) から両者が改善することはできない.

L R
U (0, 3) (2, x)
D (1, 2) (3, y)

補足 3.2. 3.1で Player 1 の利得を以下のように割り当てると失敗する.

L R
U (0, ?) (1, ?)
D (2, ?) (3, ?)

補足 3.3. 3.1で Player 1 の利得を以下のように割り当ててもよい.最後に得られる利得行列はシンメトリックになる.

L R
U (1, ?) (3, ?)
D (0, ?) (2, ?)

あるいは「縦書き」に数字を増やして,

L R
U (2, ?) (0, ?)
D (3, ?) (1, ?)

(HRM からの寄稿)

【2009/04/27 07:28 】
| 社会科学 | コメント(4) | トラックバック(0) |
選択の苦悩: 行動経済学的仮説

経済学はプロセスを無視して帰結だけに注目するか?」であつかった意思決定問題を再び考える (「元ゲーム」と呼ぶ; 第1段階で「流産」とあるのはもと記事では「妊娠に失敗」と修正済み):

受精卵取り違え問題

今回は特に第2段階である患者の情報集合に注目し,第3段階の「自然」の選択を考慮した上で患者の期待利得を割り当ててみた (「標準モデル」):


患者にとってもっとも望ましいアウトカムは自分たちの子が生まれる場合であり,自分たちの子を中絶するのはそれに劣るのは間違いないだろう.また,患者の行動から,他人の子を中絶する場合の利得は産む場合の利得よりも高かったと考えざるをえない.ボクに分からないのは,自分の子を中絶する場合の利得が (a) 他人の子を中絶する場合よりも上なのか,(b) 他人の子を中絶する場合と産む場合のあいだなのか,(c) 他人の子を産む場合よりも下なのか,である.とりあえず図では自分の子を中絶するのが最悪であると仮定した.

蛇足.利得が直観的に受けいられるものであるべきかどうかは,目的によると思う.予想することが目的であって,かつ利得をしめさずに「ゲーム理論によればこうなる」という言えば納得してもらえる状況なら,利得が直観に合っていなくてもあまり問題はないかもしれない.しかし,説明することが目的であるならば,利得は直観に反しない納得できるものであるほうがよさそうだ.

患者の主観 (見積もりあるいは「信念」) によれば,妊娠した子が自分の子である確率 が q で,他人の子である確率が 1-q であるとする (ただし q は0以上1以下).患者の情報集合における利得を計算すると,

  • 「中絶」を選んだ場合の利得: -3q-1(1-q)
  • 「生かす」を選んだ場合の利得: 1q-2(1-q)

となる.自分たちの子である確率 q が (1/5より) 高ければ「生かす」が最適で,他人の子である確率が (4/5より) 高ければ「中絶」が最適となる.(q=1/5 という値のときに2つの選択が無差別になるのは,自分たちの子であるときの2選択の利得差 4 と他人の子であるときの2選択の利得差 1 から来ており,q = 1/(4+1) となっている.) ここで注目すべきは,確率 q がどうであれ,図の4つのアウトカム中最悪の場合の利得 (-3) よりも利得が低くなることはないことだ.

これに対して,「妊娠したのが自分の子と分かって中絶する方が,自分の子か他人の子か分からずに中絶すべきかどうか迷う状況よりはマシだ」という考え方があるかもしれない.「妊娠したのが自分の子かどうか不確実性を残したままで,中絶するかどうか選択しなければならない苦悩」というジレンマが表されていないという批判だ.

その批判への応え方はいろいろあるだろうが,ゲーム理論の標準から離れて行動経済学的領域に入って行く必要がありそうだ.次の図にしめす利得は,行動経済学の成果などはまったく考慮せずにボクが勝手に想定した仮説だ (「非標準モデル」).

自分としてはあまり踏み込みたくない領域ではあるが,以前このブログ記事「非循環性なしの社会選択理論が出現!」で紹介した隈部正博と経済理論家・三原麗珠との論文さえも行動経済学の成果に言及するような戦慄すべき時代だ.ここでは「トンデモ」あつかいされるのは覚悟で大胆な仮説を提示してみた.社会科学の伝統を無視して,勝手なやり方で限定合理性を想定するような工学者並なみに堕ちていると言われても仕方ない.「学問への政府介入の危険性も認識できない彼らの理系的絶望的能天気さに屈するのか?」と叩かれもするだろう.「学問の自由を守る気概もない理系バカとお前は変わらないではないか?」と問いつめられもしよう.すべて正当な批判だ.それでもボクは,あらゆる屈辱を乗り越え,恥を忍んでここに提示する.


非標準モデルが標準モデルとちがうのは,d(q) だけ利得が引かれていることだ.より具体的には,

  • d(q) = 0 if q = 0 or 1
  • d(q) = d if q is not 0 or 1

としておく.これにより,妊娠した子が確実に自分の子である場合と確実に他人の子である場合を除いて,d > 0 だけ利得が下がっている.不確実性が少しでも入ればある定数分だけ利得が下がることによりジレンマを表したものであり,利得関数は q = 0 あるいは 1 のところで不連続となっている.不連続な利得というのは伝統的とは言えないだろうが,ありそうな感じもする.患者の利得がこのような不連続性を持つかどうかは,(情報集合自体を選択できるようにした上で,q を 0 あるいは 1 に近づけて行くような) 実験によって確かめられないこともないだろう.

このモデルが標準からおおきく逸脱しているのは,利得が確率 q という均衡において内生的に決まる変数に依存することだ.しかしそれは一般論であり,いまのばあいは最初の図を見れば分かるように,q は与えられた元ゲームからベイズの法則により求められる.第1段階で「自然」が 11 を選ぶ確率を p1と,00 を選ぶ確率を p0 とすると,条件付き確率 q = p1/(p1+p0) と求められる.p =(p1, p0) におうじて異なる元ゲームがあると考えれば,利得が q に依存するのはさまざまなゲームを考えているためということになり,標準に取り込むことはできる.

この非標準モデルにおける患者の行動は標準モデルと変わらない.q を固定してしまえば,利得は標準モデルと同じ (q=0 or 1 のとき) か,定数を引いただけ (q がそれら以外のとき) であるためだ.苦悩は患者の選択行動自体は変えないのだ! 別の言い方をすれば,標準モデルでも患者の行動は十分説明できることになる.

しかし苦悩は患者の選択時の利得を (不確実性がなかった場合の最悪よりもさらに) 下げる.これは標準モデルでは説明できない.妊娠した子が確実に自分の子か確実に他人の子か分かっている場合 (q = 0 or 1) は仮想的な状況に過ぎないが,ひとはそういう状況を想像することはできるし,現実に直面した不確実性の残る状況 (q が 0 と 1 以外) とそういう状況を比較することもできる.患者の苦痛はそういう種類の比較から生じたものだったと言えるかもしれない.

そして患者がこの種の比較をしているということは,「自然」が最初に選択するときの確率 p=(p1, p0) が異なる (その結果 q も異なる) いろんな「元ゲーム」に患者が参加しているためとも考えられる.たとえば患者が最初に参加するかどうかを選び,参加するならば「自然」がまず p を選び,その選ばれた p に依存する「元ゲーム」が始まるというふうに考えれば,部分ゲームとしてさまざまな「元ゲーム」が現れることになる.

(HRM からの寄稿)

【2009/02/27 11:43 】
| 社会科学 | コメント(0) | トラックバック(0) |
経済学はプロセスを無視して帰結だけに注目するか?

伏線は敷いたので,今回は経済学の話題を提供しよう.

まずは「近所で起きた受精卵取り違え: 被害感情を想像してみる」でとりあげた意思決定問題を,展開形ゲーム (正確にはゲームフォーム) で表現してみる (OpenOffice.org の図形描画を利用した):

受精卵取り違え問題

第1段階で「自然」の取りうる選択肢は3つある: 11 (患者夫婦の子を妊娠させる); 00 (他人の子を妊娠させる); nat (妊娠に失敗する; 図では「流産」とあるが,この段階での用語としてはふさわしくなかった).(医者はあくまでも患者自身の子を妊娠させること 11 を目指して行動するので,能動的に選択は行わない.よってこの段階でプレーヤとなるのは不確実性を表す「自然」であり,「自然」は妊娠失敗を選ぶ以外にも医者にミスを起こさせることもできる.この段階で「自然」が選べる選択肢には片方の親だけが他人になる 01 と 10 というのもあるが,ここでは無視する.) 医者がミスして 00 となる確率はほとんどゼロだが,妊娠に失敗する (nat) の確率が相当大きいので,夫婦の希望通りに妊娠する (11) のはかなりラッキーな場合だ.妊娠に失敗すれば子供のいない状態 nil が実現し,これは (とりあえず) 治療前と同じだ.

第2段階では,妊娠を知った患者夫婦がその子を中絶するか生かすかを選ぶ.(この段階では妊娠したのが自分の子かどうか区別できないため,図で示すように「患者」を表す2つの丸を点線で結んで「情報集合」とした.) 中絶すれば子供のいない状態 nil になり,生かせば第3段階の自然の選択により流産するか生きるかが決まる.流産したら子供のいない状態 nil になり,生きれば自分たちの子供ができる (11) か,他人の子供ができる (00).

最終的な状態は a1 から a7 の 7つがあり,これらは「帰結」を表すため「アウトカム」とも呼ばれる.アウトカムをどう記述するか,あるいは認識するかが問題であり,図では nil, 11, 00 の 3 種類だけを区別して括弧内に書き込んだ.それぞれ「子供のいない状態」「自分たちの子ができた状態」「他人の子ができた状態」という帰結を表す.

ここで気づくべきことがある.nil とラベル付けされたアウトカムが 5 つあるが,それらは同じ結果とみなす必要はないということだ.たとえば

  • 最初から流産した場合 (a7) と,
  • いったん妊娠して中絶したが,その子が
    • 自分たちの子供だった場合 (a1) と
    • 他人の子供だった場合 (a4)

とでは,ちがうあつかいをしていいはずだ.

じっさい,上のような展開ゲームまで描いておいて,異なるプロセスで得られた 5 つのアウトカムを区別しないのは,バカげた話だ.それらを区別しないのは,ゲームを描く人の問題であって,展開形ゲーム自体の記述力不足の問題ではない.それぞれのアウトカムにたいして,根っこにある「自然」からそのアウトカムに至るパス (経路) は一意に決まる.(グラフ理論の定理を探すまでもないだろう.そのアウトカムの親,その親の親,……が一意に決まるので,それらの先祖を順次辿って根っこまで戻ればいい.間違えていたら指摘してくれ.) たとえば a2 に至るパスは,一連の選択を列挙することにより,

11-生かす-nat

と書ける.あるいはプレーヤーや端点までふくめて「自然-11-患者-生かす-自然-nat-a2」のようにより詳しく書ける.

つまり,アウトカムはこれら異なるパスの数 (上図では 7 個) だけ区別できるのだ.(上の図でアウトカムを nil と 11 と 00 だけに区別したのは,本来区別できるいくつかのアウトカムを同一視したためである.) そしてパスというのは,最終的な帰結に至るプロセスを表している.よって展開形ゲームを考えれば,あるところまでは特段苦労もなくプロセスを表現できるのだ.多くの文脈では批判として現れる「経済学はプロセスを無視して帰結だけに注目する」という主張は,少なくとも (展開形) ゲーム理論にたいしては当てはまらない.

リマーク.前回記事「近所で起きた受精卵取り違え: 被害感情を想像してみる」を振り返ってみよう.そこでは nil-->x-->y という全プロセス中で,すべてに共通である最初の nil は無視して,x, y, そして「x-->y の変化のあり方」の3つの要素からなる「一般化選択肢」を

(x, y, x-->y)

と表現した.この「一般化選択肢」とは,今の記事で言うところの (パスの情報を暗にふくむことで適切に区別された) アウトカムに過ぎない.対応は次のようになる:

  • x は第1段階での「自然」の選択肢である 11, 00, nat のいずれか,パスの前半部分.
  • y は a1 から a7 のアウトカムの括弧内に記述された 11, 00, nil のいずれか.アウトカムの不十分な記述.
  • x-->y は「abort」あるいは「生かす-nat」あるいは「生かす-生きる」.パスの後半部分.

さて,ゲーム理論を取り込んだ現代経済学にたいして,「経済学はプロセスを無視する」という批判は当てはまらないことを確認した.しかし,経済学が伝統的にプロセスを無視して帰結だけに注目しようとしてきたことは間違いではないだろう.過剰なほどにプロセスを記述しようとする他の社会科学から自らを差別するため,できるだけシンプルに社会現象を記述しようとした結果かもしれない.それゆえ経済学は「帰結主義的」であるとされて来たのであり,その傾向は特に (だれがなにをどれだけ消費するかという「配分」だけでアウトカムを表す) 一般均衡理論に強く現れている.

そういう経済学の伝統的な帰結主義的傾向をもっとも真剣に批判したのは社会選択理論家である.(それがゲーム理論家でなかったのは,社会選択理論家がもともと規範的問題 [価値判断にかかわること] を重視しているという事情によるだろうが,ゲーム理論家にとってはプロセスはもともと記述できるものだからかもしれない.) たとえば鈴村興太郎は,選択の機会集合や選択手続きなどにも内在的な価値を認めるアプローチを押し進めることで,伝統的な帰結主義を乗り越えようとしている.

ここでは鈴村の挙げる以下の端的な例を考えてみよう (Kotaro Suzumura, Consequences, opportunities, and procedures, Social Choice and Welfare 16: 17-40, 1999, の Example 1 を若干修正; べつに鈴村教授の代表作というわけではないが,ちょうどいい例が載っていたので採り上げた).二人姉妹がケーキを分ける問題を考える.量だけが問題だとすれば,配分は (x1, x2) のように書け,x1 は姉の取り分,x2 は妹の取り分である (ただし x1+x2=1).いまふたつの分け方 F, G を考える.Fは「公正なる父親の独裁的判断」であり,G は「姉妹自身による分割ゲーム」である.いずれの分け方でも結果として等分である (1/2, 1/2) という配分がアウトカムとして得られた.

もし伝統的経済学のように (?) アウトカムである配分だけに注目すれば,これらの2つの分け方は同等と判断することになる.「しかしそれで適切か? 姉妹たち自身が決める権利があるかどうかの違いは無視できないだろう」というわけで,Suzumura は「拡張された選好」というものを定義したフレームワークを提示する.手続き H で配分 x が実現したとすれば,そのペア (H, x) に利得を与えるような話だ.

では,ゲーム理論家ならどう考えるだろうか? べつに配分だけに注目するわけではないだろう.おそらく次の図のような略されたゲームフォームを考えるのではないか.


第1段階で選択する「プレーヤー」とは,姉あるいは妹あるいは姉妹と考える.特にそれが姉妹のばあいは,ある種のゲームを略して「プレーヤー」とある楕円で示していると考えられる.それが姉あるいは妹の場合は,この段階では単純に2つの選択 (F に参加するか G に参加するか) を与えられていると考えてよい.そして図中で (1/2, 1/2) とある配分の代わりに彼女の利得を考えれば,それらふたつの配分は利得において区別できる.同じ (x1, x2) という配分が得られたとしても,「F でそれが得られた場合よりも G でそれが得られた場合の方が彼女の利得は高い」といった具合に.このアプローチは Suzumura (1999) の提案するところと大差ないと言えないだろうか?

以上から分かるように,現代経済学,とりわけゲーム理論は帰結主義を乗り越えることができる.ただし,できることと実際にやることとはちがう.経済学の伝統的な帰結主義的傾向を実際に正面から見直して来たのは,ゲーム理論家というよりは,鈴村らをはじめとする社会選択理論家だったと言えるだろう.

(HRM からの寄稿)

追記 (2/27/2009). 「第1段階で「自然」の取りうる選択肢は3つある: 11 (患者夫婦の子を妊娠させる); 00 (他人の子を妊娠させる); nat (流産させる)」とあったのを「第1段階で「自然」の取りうる選択肢は3つある: 11 (患者夫婦の子を妊娠させる); 00 (他人の子を妊娠させる); nat (妊娠に失敗する)」と修正.面倒なので図はそのままにしてある.

【2009/02/23 07:27 】
| 社会科学 | コメント(3) | トラックバック(1) |
非循環性なしの社会選択理論が出現!

「それってすごいことなの?」って? 経済理論を教える大学教授にでも聞いてくれ.

ここでは最初に「社会選択のコアにかんするクイズ」の正解例を与えよう.問題 1, 2 の正解はいずれも「否」であり,反例は以下のとおり.個人 i が x を y より好む (xPiy) ことは,点 x から点 y へ向かう矢印を描いてその枝にラベル i をつけることで表している.

Graphviz ソースファイルはこちら.点の配置や枝の形状などを気にし始めると,Graphviz は簡単ではないことが分かった.問題 2 の図では,点の場所を pos で強制的に指定することで対応.

問題 1 の正解例

コアに属する選択肢がどの個人の極大要素にもならないことがある.たとえば以下の図でコアは集合 {d, e} だが,d は各人の極大要素集合のユニオン {a, b, c, e} に属さない.だれにとっても極大でないものが解の中に紛れているのだ!

問題1の反例

問題 2 の正解例

空でないにもかかわらず,コアが個人の極大要素をあつめてきた集合と交わらないことがある.たとえば以下の図でコアは集合 {d} だが,各人の極大要素集合のユニオン {a, b, c} と交わらない.だれかにとって極大になるようなものが解のなかにひとつも存在しないのだ!

問題2の反例

以上の例は Kumabe and Mihara (2008) の Examples 1 と 2 そのものである.要するにコアというのは,各人の極大要素集合と相性があんまりよくないのだ! 「相性が悪い」と言ってしまってもいいかもしれない.

ところでコアの概念をまちがって理解すると,上のいずれの図においても,あやまって選択肢 d をコアから除外してしまうことになる.つまり「d 以外の選択肢をより好む個人が過半数 (この場合は2人以上である全員) いるので,d はコアには入らない」と考えてしまうのだ.選択肢 d がコアから除外されるためには,本当は過半数が一致して他のある選択肢 x を d より好まなければならないのだが,「別の選択肢を一致してより好む」という条件を見落とすわけだ.

この誤解にもとづいてコアを再定義し,"the core without majority dissatisfaction" (多数不満なきコア?) と名付けたのが Kumabe and Mihara (2008) である.おそらく著者のひとりである経済理論家が共著者の数学者に「コア」をいい加減に説明した際に,数学者のほうが誤解し,それに気づいた経済理論家が「おもしろいからその誤解を定義にすればいいじゃん!」と応じたのであろう.「失敗を成功につなげた」ささやかな例である.(事実無根です.そういうドラマは著者たちのあいだでは展開されなかったそうです.)

そして注目すべきは,この core without majority dissatisfaction というのはもともとのコアとちがい,問題 1, 2 の性質をいずれも満たすことだ! つまり core without majority dissatisfaction は各人の極大要素集合とトテモ相性がいいのである.詳しくはそのペーパーの Section 3 を参照してもらおう.

ところで Kumabe and Mihara (2008) だが,以上説明した内容がその主要貢献ではない.その主要貢献は,社会選択理論で長らく「最小限の要件」とされて来た「選好の非循環性」を取り払ったことにある.「非循環性なしの選好集計理論」というタイトルがしめすとおりだ.(非循環性がほとんど欠かせない条件であることについては,「極大要素の存在: 美人ホールを求めて」を参照.どうでもいいが,現状のタイトルはぎこちないんじゃ?---"without" を二度使うか?) 具体的には中村の定理を拡張する結果を提示している. (中村の定理については「コアにかんする中村の定理」を参照.)

「最小限」とされてきた要件を取り除くという画期的なことをする以上,これまで受け入れられて来た常識からどこかで離れる必要はあったはずだ.じっさい Kumabe and Mihara (2008) の集計理論は,社会選択理論の根底にあるシナリオの書き換えを迫っている.イントロダクションが長くなっているのは,そのシナリオの転換についてやや「哲学的な」議論を展開しているためである.

「哲学とか言うなよ.自分は技巧派だ」という理論家は,この論文を「集合論でいうところの順序数の理論を経済学に応用したもの」として読むだけでも悪くないだろう.順序数といえば,0, 1, 2, 3, 4, ... の無限の先に ω という「数」が来て,さらに ω+1, ω+2, ... と続く,いやいや,もっともっと続くアレだ.無限のところでカウントし続けるやつだ.と言っても知らない人も多いだろう.さいわいこの論文はたった 1 ページ強で順序数の解説をしているので,参照するといい.(「年末は家具の入れ替えとか順序数とか」も多少は参考になる.) 順序数という技巧が経済理論で使われるのはかなりラディカルだが,社会選択のシナリオの転換をラディカルに迫る以上,技巧もラディカルにならざるをえなかったということだろう.ラディカルな技巧ではあっても,むずかしいというわけではないので,尻込みする必要はない.

参考文献

Masahiro Kumabe and H. Reiju Mihara (2008). Preference aggregation theory without acyclicity: The core without majority dissatisfaction.

(HRM からの寄稿)

【2008/11/25 16:00 】
| 社会科学 | コメント(0) | トラックバック(2) |
前ページ | ホーム | 次ページ
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。