まじめに掃除する人もいますが、サボる人もいます。 解説 下図は「企業」と「学生」の「囚人のジレンマ」的状況です。
お互いに「黙秘する」を選択した場合:どちらも懲役2年• ビジネスセミナー• ここで発想を変えてみましょう。
2人はある犯罪に関連した別件容疑で警察に捕まった。
ナッシュ均衡は、こうしたゲームに共通する基本的な均衡概念を示した理論であり、ゲーム理論ならびに経済学に大きな発展をもたらした理論であると言われています。
参考: ここで「モノの値段が下がるのなら、消費者にとっては良いことなのでは?」と考えた方は、少し注意が必要です。
ナッシュ均衡とパレート最適は必ずしも一致しない。
また、互いに裏切り続けるのも均衡として残る。
そこで、しっぺ返し戦略に代わって「寛容なしっぺ返し」戦略が台頭する。
アクセルロッドの研究は研究者の間で評判がよくなかった。 しかし、相手が裏切って自白した場合、自分は懲役10年になってしまいます。 消費者であると同時に労働者・生産者です。
1共有地で何人かの村人が羊を放牧し、お金に羊を換えていました。 第二に、 個々の主体が自分にとって最も合理的な結果になるように行動していたことです。
すなわち割引因子が十分に高い場合に協調が生まれる可能性がある。
このように、 各人が自分にとって一番魅力的な選択肢を選んだ結果、協力した時よりも悪い結果を招いてしまうことを「囚人のジレンマ」と呼びます。
サボる人は「ずる」をしているのですが、どうしてそんなことをするのでしょうか?あなたはどっちのタイプですか? 実は、掃除当番という制度には、「ずる」をしてサボりたいと思わせてしまう欠点があるのです。
有限繰り返しゲームにおいては、最終回のゲームから順に後退を適用することで全てのゲームで裏切りを選択するのが均衡となることを導いた。 C 協力 B 協力 B 裏切り A 協力 (3, 3, 3) (1, 5, 1) A 裏切り (5, 1, 1) (4, 4, 1)• ビンモアによると、アクセルロッドの貢献はただ一点。
しかし、容疑者Aが裏切って「自白」を行い、容疑者Bは「黙秘」を続けていれば、Aは無罪でBは懲役5年になってしまいます。
すると、どうでしょう? 答えは、AさんもBさんも「いいえ」と回答し続け、最終的に得られた賞金を4万円ずつ山分けすることです。
2-3:囚人のジレンマとパレート最適・ナッシュ均衡 ゲーム理論を考えるうえで、他によく登場する関連用語に「パレート最適」と「ナッシュ均衡」があります。
「囚人のジレンマ」における「ナッシュ均衡」 「囚人のジレンマ」の例では、二人とも自白しない場合はナッシュ均衡ではありません。 別の記事で紹介していますので、併せてご覧ください。 ということで、初期状態の「2人とも黙秘」はパレート最適なのです。
17そのようなときに自分だけ「ずる」をすれば、相手よりも優位に立って勝てる可能性が高くなります。 , pp. 例えばBが「黙秘」を続けると仮定した場合、Aとしては自分も「黙秘」を続ければ懲役1年になってしまいますが、「自白」すれば無罪になります。
各個人が合理的に選択した結果()が社会全体にとって望ましい結果()にならないので、とも呼ばれる。
しかも自分は減収なのに、沢山獲った漁師は増収になります。
自白が1人だけであれば、すぐに自白した人は釈放されるが、5年の禁固刑に他の1人はなる• このように無数の均衡が存在することはで示される。
そこで、以下の利得行列によって表されるゲームについて考えます。
1人が自白して、もう 1人が黙秘の場合 自白した人は無罪で、黙秘した人は懲役 10年• 「需要者」対「供給者」の関係• 「囚人のジレンマ」の研究の中で,一般の人に有名で影響が強く,分かりやすいのはロバート・アクセエルロッドのコンピュータプログラムどうしのトーナメントによる実験であろう.この本は,その詳細をな結果や経緯をもとに,囚人のジレンマ研究のビジネスへの応用が解かれている.• 囚人のジレンマでいうパレート最適は、「お互いに黙秘してそれぞれが懲役 2年」という選択です。 ナッシュ均衡の意味• これって間違ってますね。
さらにアクセルロッドが参加プログラムについて進化シミュレーションを走らせたところ、生き残った戦略のなかでしっぺ返し戦略の数が最大であった。
ただ、証拠がありません。
以上の議論から、ナッシュ均衡解である「2人とも自白」は「パレート最適ではない状態」であることが分かりました。
それぞれの製鉄会社には、製鉄を「増産」するか「現状維持」するか2つの選択肢が与えられている。 Aさんが否認する:Bさんは否認すれば10の利得、白状すれば15の利得を得られるのでAさんは「白状」する• さらに、現実社会の事例として牛丼値下げ競争を囚人のジレンマゲームとして解釈しました。
6彼らは公共のために自分のお金をいくら出すか決めます。 適当にif文をいっぱい並べて15回まわします。
協力ゲームと非協力ゲームは、あくまで利害が異なる対立関係の環境分析の手法のひとつに過ぎず、一概にどちらが優れていると判断できるものではありません。
Aさんが白状する:Bさんは否認すれば-10の利得、白状すれば-2の利得を得られるのでAさんは「白状」する 先に相手の行動を想定し、そこから自らの行動を決めると仮定すると、選択されうるのは図2において〇のついた選択肢となります。
「協力か、裏切りか」に悩むような場面の多くは、囚人のジレンマ状況として解釈可能でしょう。
もし1人だけ0円だった場合。 安売りの問題.競争関係にある2店舗が,顧客を取り合うために,商品の価格を現状維持とするか,安売りをするかの問題.相手が現状維持の場合,自分だけが安売りをすれば顧客を奪い売上が増えるので,安売りをしたほうが良い.相手が安売りをしている場合,自分だけが現状維持をすると顧客を奪われ売上が減少するので,こちらも安売りをしたほうが良い.しかし両者が安売りをすると,顧客を奪うことはできず,価格の低下で売上だけが減ってしまう. と言った現象です.なお安売りの問題は,安売りをしている企業にとっては問題ですが,消費者にとってはそれ以上に恩恵があります.市場の価格競争は,囚人のジレンマという構造を利用して消費者の厚生を高める仕組みだと言うこともできます. 囚人のジレンマの繰り返し 囚人のジレンマは,本来なら協力することが望ましい2人が協力しない方が良いという結果になってしまうジレンマです.これは,協力することをコミットするような契約(協力しなければ罰金を払うなど)を結ぶことで解決できる可能性がありますが,国家間の関係のように,このような契約を結ぶことが難しい場合もあります.このような場合,囚人のジレンマの状況は1回きりではなく,長期間に継続する問題でもあります.このような長期間に続く囚人のジレンマは,囚人のジレンマを何度も繰り返すようなゲームだと考え,繰り返しゲームという枠組みで分析されます. 注意点 囚人のジレンマを語るには,以下のことに注意する必要があります.• ・互いに高得点を求めて行動しようとすると、互いに裏切ることになり、結果的に高得点を得られない ・互いに協力すれば高得点を得られるが、自分だけが裏切るともっと高得点を得られるので、裏切る誘惑にかられる ・自分だけではなく相手(他人)も同じように考えて、二人(全員)が裏切ると、結局、出発点である 1 の状態に戻る なぜこのジレンマ状況は注目されてきたのでしょうか? まず、社会科学者や哲学者に人間性を考察する上での格好の材料となりました。
ここで、どちらも犯罪者なので、「相棒がどうなろうと、とにかく自分の懲役年数を最小にしたい」という利己的な2人であると仮定します。
ナッシュ均衡(Nash equilibrium)とは、各ゲームのプレーヤーがそれぞれにとって最も合理的な行動を取ろうとした結果、実現した状態であれば、そこから誰も行動を変更せずその状態で均衡することです。
よって、どちらの囚人にとっても、もう一方の囚人が「黙秘」と「自白」のどちらの選択をしたとしても、「自白」を選択しておいた方が得をすることになります。
自白を2人ともすれば4年の禁固刑に2人ともなる 2人の囚人は、このような提案に対して「自白すべきか」「黙秘すべきか」ということで悩みました。 相手が裏切った時に起こること では、仮に 裏切りが起きた時に何が起きるかを考えます。
合成の誤謬とは 囚人のジレンマは、各個人が最適な行動としても、全体にとっては望ましい結果につながらないことを示しています。 しかし、値上げは自社のみで値上げを他社が行わないときは、単独で他社に大幅に売上を取られることがあるので、相手の出方をお互いに見ながら対策する必要があります。
まだ他にも「いつでも協力する」ことの問題点が指摘されています。
実際、東日本大震災の時、東北地方における早期の道路復旧や家屋建設で中核的な役割を果たしたのは、当該地域の地理を知り尽くした地元の「土建屋さん」であったと言われていますね。
一見すると、心優しいプレーヤーです。