囚人のジレンマゲームにおける協調関係の発展〜集団におけるご形成の働きの検討〜

岩崎 純也

最近の30年間、ゲーム理論の概念や手法を適用することにより、生物の進化や人間の協調関係を論ずる研究が数多く展開されてきた。特に社会心理学においては、対戦行動・互恵主義などといった多様な問題に対し、ゲーム理論を利用することにより、一定の研究成果が残されている。本論の主題は、社会心理学の立場から、他人との付き合いを続けていくうえで、相手に協調すべきなのはどのような場合で、自分本位にふるまうべき時はどのような場合かを分析・考察することである。
そのために本論において、社会心理学の研究分野の一つである、互恵性による人間の協調関係の形成について、これまで成された研究について分析・考察を展開していく。また、それらの研究の一部について、再実験を行い、過去の研究結果と比較し、より厳密な分析及び考察を行っている。互恵性を用いたうえで、具体的な社会的関係を扱うために、本論ではゲーム理論において典型ともいえる囚人のジレンマゲームを用いて、人間関係が協調へと向かう条件・裏切りへと向かう条件を分析・考察している。その手段として、直接的互恵性の観点からなされた著名な研究であるAxelrodの研究及び、Axelrodの研究をさらに深めた上で、間接的互恵性の視点を加えたNowakの研究を中心に、互恵性による協調関係の形成される条件を導くこと、そのために有効な戦略などを分析していく。その結果、Axelrodの研究から、2人囚人のジレンマにおける協調関係の出現条件として、未来係数ωが一定程度大きな値であることが証明された。また、集団安定となる戦略の特徴づけ定理についての証明及び、相手が協調していないにもかかわらず協調することが起こり得る戦略が、集団安定となるための条件として、やはり未来係数ωの値が一定以上である必要があるということが証明された。そして、囚人のジレンマゲームを繰り返すとき、最適な戦略というものは存在しないため、さまざまな戦略が存在することとなるが、その中でも『しっぺ返し戦略』が最も有効であるとの結果が導き出された。『しっぺ返し戦略』が有効である理由を検討した結果、『しっぺ返し戦略』は相手から搾取されることがないことに加えて、そのことが相手に伝わるため、相手から協調を最も引き出しやすいからであるとの結論が得られた。これは、直接的な互恵性が働くことで、協調関係が出現すると言い換えることができ、互恵性の有効性がゲーム理論においても確認された研究であった。
続いて、Nowakの研究について、分析及び考察を行った。Nowakの研究は、Axelrodの研究を発展させたものであり、間接的互恵性を利用したモデルを構築するものであった。そのモデルの一つである、評判モデルについて本論では扱った。評判モデルとは、協調することでまわりからの評判が上がり、裏切ることで下がるとした上で、評判が高い者はより協調されやすいとの仮定をおいたモデルである。このモデルによるシミュレートによると、未来係数ωが小さいときにも、間接的互恵性が働くことによって協調を得られることが示された。この実験について今回、Nowakが行ったシミュレートと同様のシミュレートを行ってみた。その結果、Nowakが示した結果はもちろん得られたが、異なる結果も50%程度の確率で生じた。Nowakが示した結果とは、評判モデルによっても、『しっぺ返し戦略』の有効性が非常に高いとの結論を与えるものであり、利得をより多く得られた者が生き残るとの、ゲームにおいて、『しっぺ返し戦略』が他の戦略を駆逐する、とのものであった。
しかし、今回の実験の結果、『しっぺ返し戦略』だけでなく、『全面裏切り戦略』に加えて、『全面協調戦略』についても、他の戦略を駆逐し、生き残る可能性があることが示された。そのような結果の差異は、生き残る者を選抜する方法がNowakのものと異なるからであることが考えられた。Nowakの研究ではルーレット方式によって選抜が行われたとの説明がなされていたが、評判モデルはコストがマイナスの値をとるにもかかわらず、ルーレット方式は総利得が正となっていることが使用条件に含まれるものである。それゆえ、今回の実験では便宜的に、利得がマイナスの値をとるプレイヤーは次世代に生き残る可能性がないものとして扱った。この点がNowakの研究と異なる可能性がある部分である。しかし、この点のみでは、『しっぺ返し戦略』が生き残る可能性の差異がそこまで生じるとは考えにくく、一定程度の確率で、『全面裏切り戦略』など、他の戦略も生き残ることが示唆された。また、遺伝的アルゴリズムの選択によって、生き残る戦略が大きく異なる結果となることも示唆された。特に、評判モデルにおいてトーナメント方式を利用すると、一度も協調していない相手に対しても協調する可能性がある『上品な戦略』のプレイヤーは、確実に駆逐されることとなった。トーナメント方式においては、自らが得た利得の合計よりも、他のプレイヤーが得た合計との比較がより優先されることとなるために、協調関係がより築かれにくいものとなることが示された。
これらの結果から、同じ状況を読み解くときにも、選択するモデルによって、導かれる戦略は大きく異なるものとなることが示された。ゆえに、モデルを現実へ当てはめて検討する際には、そのモデルがおいている前提条件をよく検討し、さまざまな状況へ当てはめていく必要がある。