スポンサーサイト
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
【--/--/-- --:-- 】
| スポンサー広告 | コメント(-) | トラックバック(-) |
囚人のジレンマの作り方

「囚人のジレンマ」については聞いたことがあるだろう.ゲーム理論ではもっとも有名なゲームだ (実際はあまり「ゲーム的状況」になっていないのだが).このブログでも「仲介者による囚人のジレンマ解決法」という記事であつかったことがある.

最近,自分で作った演習問題 (正誤問題) を見ていてふと気づいたことがある.

「ナッシュ均衡から同時に二人が離れる (戦略を変える) ことによって,その二人の利得が両方とも改善されることはない」というステートメントの真偽を尋ねる問題だ.正解は「偽」で,囚人のジレンマを反例としてあげればよい.

囚人のジレンマを反例としてあげてくれればその問題の正解にはなる.その問題の場合ほかにももっと簡単な反例はあるが,問題によっては囚人のジレンマくらいしか思いつかないものもあるだろう.そういう問題ではしばしば「囚人のジレンマ」と答えるだけでは不十分で,出題者は利得行列を要求することが多い.すると「囚人のジレンマの利得は暗記しないといけないのか? あの数字はどうやって思いつくんだ? 手品じゃないんだから種明かしくらいして欲しい」という学生が現れるかもしれない.「ゲーム理論家は賢いからそんな数字はすぐ思いつく.ゲーム理論をマスターできるような学生にとってもそんなことは十分簡単なはずだから,その数字をどうやって思いついたかなんてことはどのテキストにも載ってないよ」と突き放せばいいのかもしれない.じっさい,作り方なんて載せてるテキストを見た記憶がない.だが,そうすると本気で囚人のジレンマの利得表を丸暗記しようとする学生が出て来るかもしれない.それは教育的にはあまり望ましい状況とは言えないので,以下に作り方を解説してみる.

リマーク.こういう天から突然与えられたような例は数学や経済理論をやっているとしばしば遭遇する.たとえば社会選択では多数決で選択肢 a が b に勝ち,b が c に勝ち,c が a に勝つようなサイクルを与えるような選好の組が突然出て来る (たとえば投票者 1 は abc の順に選好,2 は bca の順,3 は cab の順).その作り方はまず説明されない.

簡単なので説明しておこう.要するに a→b→c→a のサイクルを最初に考えて,1の選好はこのサイクルのc→a 部分をぶった切ったもの,2の選好は a→b 部分をぶった切ったもの,3の選好はb→c部分をぶった切ったものとすればいい.図式は三原麗珠のアローの定理解説ビデオの 2:59 あたりからの解説にある.(同ビデオのスライドの pdf は香川大学学術情報リポジトリにある.)

まず,(もっとも簡単な) 囚人のジレンマは2人ゲームで (プレーヤーは Player 1, Player 2 とする),プレーヤーはそれぞれ戦略を2個持つことくらいは覚えておこう (Player 1 の戦略は U, D で,Player 2 の戦略は L, R としておく).そうすると戦略の組は4つしかない.したがって利得表を埋めるための数字としてはたとえば 0, 1, 2, 3 の4個を用意しておけば十分である.

詳細.まず,Player 1 が順序付けすべき対象は,4つの戦略ペアだけである.混合戦略を考えないという前提では,利得の意味するものはその大小関係にすぎない.したがって(1, 2, 2.1, 2.101) なんていう4つの数字を (0, 1, 2, 3) と言い換えたところで問題はない.同様に Player 2 の利得を表すにも 4 つの数字で十分だ.読者は 「Player 2 は Player 1 の 10 倍感じる」ということを表現しようとしてPlayer 2 の利得に使う数字を (0, 10, 20, 30) としたいかもしれないが,これも (0, 1, 2, 3) と言い換えられる.つまり非協力ゲーム理論では通常は「Player 2 は Player 1 の 10 倍感じる」なんて個人間比較は意味がないものとされる.じっさい非協力ゲーム理論のまともな解 (均衡概念) をみれば分かるように,異なる戦略ペアにたいする特定のプレーヤの利得の比較はするが,異なるプレーヤー同士の利得は比較しない.(均衡の定義で左辺に i の利得が,右辺に j の利得があるような式は現れないはずだ.)

あとは囚人のジレンマの (i) ストーリーあるいは (ii) 特徴のいずれかを覚えておけばよい.

囚人のジレンマの作り方 1

囚人のジレンマのストーリーを覚えておく.そうすると 4 つある戦略ペアをどういう順番でそれぞれの囚人が順序づけるかは分かるはずだ.利得の低い方から 0, 1, 2, 3 の値を当てはめればできあがり.

囚人のジレンマの作り方 2

この作り方では 0, 1, 2, 3 から利得を当てはまる必要はない.囚人のジレンマの特徴として以下を覚えておく (最後2つの特徴は本質的ではないので,作り方 3 では外す):

  • 各プレーヤーは (強い) 支配戦略を持つ.
  • (均衡である) 支配戦略の組に対応する利得ペアよりも両者にとって望ましい利得ペアがある.後者の利得ペアに対応する戦略ペアはとうぜんナッシュ均衡ではない.
  • 均衡での利得ペアは (u, u) のように両プレーヤーの利得が等しいものになっている.また前項で言う,均衡におけるものより望ましい利得ペアは (u', u') のように両プレーヤーの利得が等しいものになっている.
  • 利得ペア (u, u) は利得表の右下,(u', u') は左上に現れる.

2.1. 均衡における利得ペア (u, u) を適当に決め,u' = u + 1 とする.仮に (u, u) = (1, 1) とすると,(u', u')=(2, 2) になる.

2.2. この段階で利得表は以下までできている.

L R
U (2, 2) (?, ?)
D (?, ?) (1, 1)

あとは,D と R が支配戦略になるように表を埋めれば以下のようになる.ここでは戦略を切り替えたときの利得の差が 1 になるように揃えた.

L R
U (2, 2) (1-1, 2+1)
D (2+1, 1-1) (1, 1)

つまり,

L R
U (2, 2) (0, 3)
D (3, 0) (1, 1)

補足2.1. もし利得を 0, 1, 2, 3 から選ぶならば, (u, u) = (1, 1),そして (u', u') = (2, 2) となる.

  • (u, u)=(0, 0) にはならない.もし (0, 0) であれば,(可能な利得が 0, 1, 2, 3 と,すべて 0 以上であるため),D や R が支配戦略であることに反する.
  • 一方,(u', u')=(3, 3) にはならない.もし (3, 3) であれば,(可能な利得が 0, 1, 2, 3 と,すべて 3 以下であるため) (3, 3) に対応する戦略ペアがナッシュ均衡になってしまう.
  • 以上より,0< u < u' < 3 であるから,u = 1, u' = 2 となる.

補足 2.2. 利得ペア (u, u)=(1, 1) を利得表の右下にすれば,利得ペア (u', u') = (2, 2) の位置は左上になる.

もし (u', u') = (2, 2) を以下の図のように右上に持って来ると,D が支配戦略であることに反する.

L R
U (?, ?) (2, 2)
D (?, ?) (1, 1)

同様に, (u', u') = (2, 2) を左下に持って来ると,R が支配戦略であることに反す.

囚人のジレンマの作り方 3

「囚人のジレンマの作り方 2」で挙げた囚人のジレンマの特徴のうち,最初の2つを使う.各プレーヤーの利得には 0, 1, 2, 3 の数をすべて使うことにする.

3.1. Player 1 の利得を以下のように割り当てる.この割り当ては覚えておいた方がいい (補足 3.2).

L R
U (0, ?) (2, ?)
D (1, ?) (3, ?)

3.2. D が支配戦略になっていることに注意すると L が支配戦略になることが分かる.(詳細.もし,R が支配戦略ならば (D, R) が支配戦略の組となるが,Player 1 の利得が 3 なので,これより改善できないことになる.)

3.3. Player 2 の (D, L) における利得は 0 あるいは 3 にはならないことに注意する.(詳細.この利得が 0 ならば,L は支配戦略にならない.この利得が 3 ならば, (D, L) が支配戦略の組となるが,Player 2 の利得が 3 なので,これより改善できないことになる.)

もし Player 2 の(D, L) における利得が 1 ならば,利得表は以下の通りに決まり,これは囚人のジレンマになる.(均衡を右下に持って来たければ,L の列と R の列を入れ替えればよい.シンメトリックな利得行列が得られる.)

L R
U (0, 3) (2, 2)
D (1, 1) (3, 0)

補足 3.1. 3.3でもし Player 2 の(D, L) における利得が 2 ならば,利得表は以下のようになり (ただし (x,y)=(0, 1) or (1, 0)), 均衡 (D, L) から両者が改善することはできない.

L R
U (0, 3) (2, x)
D (1, 2) (3, y)

補足 3.2. 3.1で Player 1 の利得を以下のように割り当てると失敗する.

L R
U (0, ?) (1, ?)
D (2, ?) (3, ?)

補足 3.3. 3.1で Player 1 の利得を以下のように割り当ててもよい.最後に得られる利得行列はシンメトリックになる.

L R
U (1, ?) (3, ?)
D (0, ?) (2, ?)

あるいは「縦書き」に数字を増やして,

L R
U (2, ?) (0, ?)
D (3, ?) (1, ?)

(HRM からの寄稿)

スポンサーサイト
【2009/04/27 07:28 】
| 社会科学 | コメント(4) | トラックバック(0) |
大学新入生へ

大学へようこそ.「新入生へのメッセージ」ということで原稿を頼まれたので,大学教員として,そして「先輩」として,アドバイスをしてみる.ボクは留年も退学も転校も卒業延期も経験したし,大学の教務主任にお願いして卒業要件を変えてもらったことさえある.長い学生時代を過ごしたので,それなりに有用なアドバイスもできると思う.抽象的・精神的な訓話をするつもりはない.みなさんそれぞれが目指す職業人 (ボク自身で言えば学者) への道のりを少しでも楽なものにできるような情報を提供したい.(ただしボク自身はけっこう無駄なことをやってきた.決して最短コースで学者になったわけではない.)

みなさんの多くは高校までは学校の勉強や受験勉強をしていれば済んだかもしれない.しかし大学生になったら勉強しなければならないことは一気に増える.専門として選んだ学問分野だけではない.効率的にやるためそして長期間継続できるようにするために,勉強法を工夫する余地は大きい.よって勉強法の本も少しは読むといい.たくさん読む必要はない.(受験勉強法にやたら詳しい一方で受験勉強自体はあまりやらない受験生みたいになってもしょうがない.) ボクが気に入ったものを数冊紹介する.

  • 野口 悠紀雄. 「超」勉強法. 講談社, 2000.
  • LifeHack/GTD (Getting Things Done) にかんするネット上の情報.勉強法というよりは仕事法.ボク自身はきちんとやったことはない.でも,やりたいことをすべて書き出して頭のなかを空っぽにするというていどなら昔からやってる.
  • 佐々木 正悟. 脳と心を味方につけるマインドハックス勉強法. 日本実業出版社, 2008.
  • 金出 武雄. 素人のように考え,玄人として実行する: 問題解決のメタ技術. PHP研究所, 2004. ただしこれは必ずしも勉強法の本というわけではない.

さて,方法が分かったら次は中身だ.(本来の順番とは逆かもしれないが,順番は気にしなくていい.仕事でも学問でも,途中経過はそれ自体を問題にしないほうがいい.要するに結果を出すことが重要なのだ.) 学生時代になにを勉強しておくべきか.自分の目指す将来像から逆算して必要なものをピックアップすればいいのだが,それは必ずしも簡単な作業ではない.勉強すべき内容としてボクが学生に薦めたいものを例示してみよう.ものによっては勉強法にかんするヒントなども添えておく.

  • 英語.繰り返し読んで文章を暗記.Podcasting を iPod で聞く.ボク自身は使ってないが,iKnow も検討に値する.
  • 韓国語.余裕があれば英語以外の外国語もマスターしよう.ボク自身は余裕がないけど.
  • 自分の専門分野.4年分あるいは大学院までふくめたカリキュラムを理解したうえで,欠かせない科目を逆算すること.
  • 専門外の関心ある分野.「雑学」でもいい.専門がきちんとしている例として学者を考えてみる.学者のばあい初歩的なものでも専門外の知識は大いに役立つことがある.自分が考えた理論の応用例を見つけたり,他分野のアイディアを自分の専門に活かしたり.
  • ゲーム理論.理論を作る方法を多くの分野に提供する.たった十数時間かけてたとえば渡辺隆裕 『図解雑学ゲーム理論』(ナツメ社, 2004) を正しく読めば理解できる論文数も一気に増えるのに,そうしない研究者が多い.経営学者とか法学者とか.学者を目指す人は,時代遅れにならないようにゲーム理論のような基礎的分野の勉強をきちんとしておこう.ビジネスを目指す人はゲーム理論で戦略的思考を鍛えよう.(ゲーム理論は多くのビジネススクールでコアになっている.) ゲーム理論の科目の例を挙げておく.
  • 統計,データ解析.実証分析のための方法を多くの分野に提供する.統計の手法を知っていると,とりあえず調査をして (どの本にも載っていないという意味で) 新たな「研究」をやったと主張することができる.実証だけでも認められる分野は少なくない.もちろんそれだけでは理論家に「理論なき実証」と批判されるけれども.
  • 情報リテラシー.インタネットや表計算ソフトの使い方など.全角空白でワープロ文書を整形するひとが少なくなりますように.
  • 線形代数と微分積分.大学初年度のもっとも標準的な数学科目と言えばこれだ.理工系学問や経済学にとってそれだけ重要であるということ.
  • 抽象数学あるいは論理学.典型的な法学者が『図解雑学ゲーム理論』を読んだだけで「ゲーム理論を制覇した!」と言えば,笑われるだろう.しかし典型的な数学者が同じことをしても笑われはしない (あるいは笑いの意味がちがってくる).数学者はこれだけでもゲーム理論の論文をけっこう読めるようになるものだ.適切に助言されればゲーム理論の先端的問題を解くこともじゅうぶんできるはずだ.抽象数学を学ぶことは抽象的思考力を高めるだけでなく,こういう (新たな分野をすばやく学習して高度な理解に達する) 効果が期待できる.集合論あるいは論理学の授業を取ることからはじめよう.
  • プログラミング.ソフトウエア開発をめざすひとにとっては当たり前.それ以外のひとにとっても論理的思考の訓練になる.学者をめざすひとにとっては,自分でプログラムして計算できる能力は今後ますます強みになるのではないか.ちょっと以前なら小さなモデルを解析的に (「理論的に」「数学的に」とほぼ同意) 分析していたような理論分野も,その一部は今後大きなモデルを数値計算的に解くことを主流とする計算分野に変貌する兆しがある.
  • 論文の書き方.一年生でも教養ゼミナールなどで論文の書き方を習うかもしれない.しかし,そこで習うのは主として他人の研究成果を引用して組み合わせるような研究法.(一次資料と呼ぶべき) オリジナルな研究成果を作ることが要求される卒業論文の書き方とは別物である.
  • 宗教・思想.人生の意味などについて最終的な答を出すのはもちろん,とりあえず納得できる答を出すのも難しい.しかしそれらについてまったく何も考えを持たない人生も無駄が多い.ある程度の方向性は持ちたい.自分が信仰するか関心を持つ宗教の教典や解説書を読もう.特に信仰を持たないひとは,自由な意思を尊重するリバタリアン (リバタリアニズム) の本を読むといい (無神論者であろうと有神論者であろうと受け入れられるはず).科学的方法を軽視する思想,短絡的に答を出してしまう思想,コミュニズム (共産主義),フェミニズム,環境保護主義には注意.
  • 人間関係,人のマネジメント,恋愛,セックス.ひとを喜ばせたい,あるいは怒らせたい,あるいは協力してもらいたいと思っても,思い通りにならないことがある.実践で学ぶことももちろん大切だが,それだけでなく戦略的思考も必要.ゲーム理論の授業をとった上で関連書を読むのも助けになる.

以上,資格取得のための勉強は挙げていないことに注意.資格のための勉強というのは,すでに知られた知識を取り込むものであり,新しい価値や知識を生み出す研究とはかなりちがう.そのため,刑務所とちがって大学では資格のための勉強は重視されない.大学にかぎらず職場も同様であり,(規制された職種以外では) 資格自体を重視するわけではない.なにかを学ぶためとか,なにか他の目的を達成するために資格を利用するのは問題ない.しかし資格取得自体が目的となってるようなひとは,自分の目的を問い直した方がいい.

最後に,受講科目の選択にあたっては,可能なかぎり優れた教員を選ぶのがいい.これを誤ると,とんでもなく遅れた知識を授けられたり,単純なものごとを複雑に説明されたりして,書籍で学ぶよりも非効率なことがある.このような失敗を最小化するためには,自分の仕事 (研究) をまともにやっている教員による科目を選ぶのがコツだ.

  • 経済学や理工系では,国際ジャーナルに論文を発表しない大学教員は一人前の研究者とはみなされない.学界的には「存在しない」に近いあつかいを受ける.業績は大学の「研究者総覧」のほか,Scopus や Google Scholar などの文献データベースで確認できる.(ただし検索ワードの設定で結果がかなり異なるので,いくつかバリエーションを試した方がいい.)
  • 大学教授というのは『新 大学教授になる方法』(ダイヤモンド社, 2001) を書いた鷲田 小彌太が言うように,頭が悪いひとが意外と多い.いったんなってしまえば淘汰されることはほとんどない.もちろん参入するまでには自殺者もそこそこ出るようなそれなりにきびしい競争はあるが,特に文系の一部分野では,学問的能力とか熱意というよりも単にどれだけ長期間貧乏かつ社会的地位のない生活に耐えられるかといった競争になっている.
  • 「頭が悪い人は同じことを理解するにも頭がいい人よりは苦労するわけだから,その一生懸命考えた経験を教育にも生かせるのではないか」と思うひともいるだろう.学生に教えるべき内容すべてについて (苦労の結果としてかどうかは問わないが) きちんと理解しているならそれでいい.問題は自分の担当科目で学生に教えるべき内容についてさえきちんと理解していない教員が少なくないことだ.
    • たとえばある概念があったとして,それがどう誤解されうるのかをいろいろと知っていることは教育者として大切だ.だがそのことと,教員本人が誤解していることとは別次元だ.正しい理解をしていなければ,誤解法を百個知っていても意味がない.
    • へたな学者は自分が意味をきちんと分かっていない用語を平気で使ったり,いく通りにも解釈されうる表現を論文のなかにいくつも残したりする.そこそこのレフェリー制ジャーナルであれば後者のような論文は蹴られるか書き直しを要求されるだろうが,そういうジャーナルに投稿しない学者は自分では気づかないでいたりする.

以上,勉強法,勉強すべき内容,そして教員の選択についてアドバイスを述べた.このエッセイがみなさんの大学在学中の糧となることを願っている.

【2009/04/19 20:25 】
| 大学 | コメント(2) | トラックバック(1) |
| ホーム |
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。