ゲーム理論 囚人のジレンマ 非協力ゲーム

 

状況

  • 強盗での共犯容疑がかかっている囚人2人に、司法取引を使い自白をさせる。
  • 強盗容疑は状況証拠のみで、一切決定的な証拠が見つかっていない、
    囚人2人に黙秘されると不法侵入でしか立件できない、それは囚人もわかっている。
  • 囚人はそれぞれの部屋で隔離して収監され、囚人同士は互いに連絡を取ることは出来ないとする。

 

司法取引の条件

  • 相手が黙秘し、お前が自白すれば無罪
  • 相手が自白し、お前が黙秘したら懲役20年
  • 二人とも黙秘で、証拠不十分により懲役1年
  • 二人とも自白したら懲役3年

 

自分が囚人Aとして考える

囚人A↓/ 囚人B → 黙秘する 自白する
黙秘する ベター
囚人A
ベター
囚人B
囚人A
×
囚人B
自白する 囚人A
囚人B
×
合理的選択
囚人A

(ここに落ち着く)
合理的選択
囚人B

(ここに落ち着く)

 

囚人Aにとって、最悪なパターンは自分が黙秘して相手が自白し懲役20年になること。
最悪を避ける行動、利己を考えると裏切って自白するのが合理的選択になる。
⇒譲歩の取引条件を囚人につけた上で、囚人に自白を誘導することができる

 

 

 

囚人のジレンマが教えてくれること

 

黙秘することが最適であることにも関わらず相手の意思決定が不確実な場合に互いに他の選択肢、ベターな選択肢を取れないことが、現実社会には多々あるということ。

 

パレート最適
exp)黙秘 × 黙秘 = 懲役1年
他社を犠牲にせずに、利己にも良い。最適化された状態

 

ナッシュ均衡
exp)自白 × 自白 = 懲役3年
お互いの利益を損ねない為に、他の選択肢を取れない均衡した状態

 

 

ジレンマを避けるには?

 

囚人同士で事前に黙秘する取り決めを行っておく、
それなら黙秘するという選択肢を取ることが出来る。

 

事前に黙秘することの約束を『コミットメント』という。

 

 

コミットメントを信用させる仕掛けとは?

 

どうやってコミットメントを実行されるようにするか、相手に信用されるのか。
この仕掛けを『コミットメントデバイス』という。

これは人間力、互いの立ち位置や背景、見返り・プレゼント(返報性の原理)、自分が裏切った場合に大きなリスクを負う状況にするなどによって、相手にコミットメントを信頼させ、また誓約させる装置。

『コミットメントを守ることが得だ』と相手が合理的に考えさせられるようにする。

 

信頼度をあげるために

その方がメリットがあると考えられる形に出来ると最高、ナッジ(行動経済学)を駆使して、こちらが用意した選択肢を相手が気持ち良く選ぶように選択を誘導出来ると良い。

 

 

マーケティングへの応用

応用①

 

企業間で付加価値が近い商品において、より廉価であることは競争において重要です。

原料費の高騰でライバル会社達は、商品価格を引き上げることがわかった。
自社は値段を据え置きとする。
他社を出し抜き、販売数やシェアを取れる

 

応用②

 

出版業界と本屋は再販制度を結んで、ベターな選択肢を取ることが出来ている

 

 

応用③

 

某携帯会社3社の競争
値下げなどで過度な競争を行わず3社間で利益の最大化を行っている。

 

 

 

応用例④

オークションの評価

某オークション
評価は取引の後の為、相手からの報復を恐れるあまり、相手が悪い取引相手だとしても、きちんと評価出来ない。
⇒評価の信頼性が危うい

 

メルカリ

両者が評価をしおわってから決済であり、評価中は相手の評価は見られず評価の修正も出来ない。
⇒正直な評価がしやすく、評価の信頼性が高くなる。

 

 

応用例⑤

競り上げオークション

オープンの場で、高値を言いあい競っていく。

⇒自分が高値をつけると新たにより高い値がつく可能性があるから、どうにかして入札額を低くしようとする力が働く。
例)根回し、終盤での入札。

 

第2価格封印オークション

 

最高値の入札者が広告掲載の権利を落札、その時に支払うのは2番目に高い入札額
⇒入札額は落札額とは関係ないので入札行動が安定する

Googleの広告入札システムは、
最高入札者が2番目の入札額を、2番目の入札者が3番目の入札額を支払う2枠方式。
第2価格オークションが連続して起こるので、『一般化第二価格オークション』と呼ぶ

 

 

 

 

応用例⑥

情報カスケード

自分が受け取った情報を無視し、人々の行動を見て従うことを合理的とする状況

 

ネットでの事前情報でA医院が良いと自分で判断して病院に向かったが、
B医院に行列があった為、B医院の行列に乗っかることが合理的な状況になる。

 

論理的な自分の判断や自分の情報に自信を失い、他社や集団にゆだねてしまう状況。
例)株価や仮想通貨の売買
※個人投資家のロスカットが一因となる場合もある。ヘッジファンドはAIなどで自動取引をしている為、連鎖的に影響がでる。

 

情報カスケードに陥らない為には?
⇒集団の行動に合理性があるか判断し、他者の行動に身をゆだねず自分で論理的に判断すること。

 

 

 

 

 

応用例⑦

銀行の取り付け騒ぎ

信用不安に陥ると、取り付け騒ぎが起こり預金者は次々と銀行からお金をおろそうとする。
⇒銀行が倒産する前にお金を下ろすことが合理的な判断になるから。
※ただし銀行には信用創造によって、取引量より現物の現金は少ない為、預金者が一斉に預金をおろすと本当に倒産します。

 

 

応用例⑧

タカ戦略、ハト戦略

 

  • 『強いものが総取り、争っても奪い取る』タカ戦略
  • 『タカが来たら争わず逃げる。負けない戦略をとる』のがハト戦略

 

タカ戦略
相手がハトなら総取りだが、
相手がタカ同士だとお互いにけがをしてしまう可能性がある、

けがはコスト

ハト戦略
タカがきたら逃げるのでけがをすることが少ない。
ハト同士の場合は利益は2分の1で分けあい共存を選ぶ

 

これをグラフ化するとタカ戦略とハト戦略の平均利益が等しくなる均衡点が発生する。

強い者に勝たずにも、
相手のことを考え、
相手に負けないように立ちまわるハト戦略でも生き残れる。

 

 

 

 

@see

  • ゲーム理論の思考法
  • 週刊ダイヤモンド ゲーム理論入門

 

 

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)