rebos 发表于 2016-7-15 23:10:42

囚徒困境



囚徒困境的本意很简单,就是两个囚徒被抓,在交待和不交待之间作选择。交待,两个人坐五年牢;不交待,两人坐三年牢;一个交待另一个不交待,交待的坐一年,不交待的坐十年牢。选择的条件很明了,但最后两个人都选择了交待,因为每个人都在赌另一个人不交待。在这中间,作弊的诱惑太大,在这种诱惑下,彼此之间的不信任感会很强烈。

那么关键是如何走出囚徒困境,这里面方法应该很多,我这里就说两个。下面就给大家做个简单的介绍。

一个方法就是第三方的存在,通过强大的第三方,强迫囚徒之间彼此合作。但是这种信任或则说是强迫,都是来自于第三方,所以当第三方变弱或则消失的时候,囚徒之间的合作会反复。总的来说就是不彻底。


另一个走出囚徒困境的方法就是,在没有强力第三方的情况下,彼此都有惩罚对方的能力。彼此都有能力在对方作弊的时候,对作弊的一方进行程度相当的惩罚。也就是以牙还牙,以眼还眼。这里的难点是对作弊的判断和惩罚轻重的判断,因为所有的惩罚都是为了最终走向合作,杜绝作弊。惩罚的过重而损害了合作也是没有必要的。这中间,彼此之间的惩罚能力是基础。

下面讨论一下,如果有一方决定实施惩罚时,情况会如何。情况就是,这会演变成一个螺旋升级的情况,一方的惩罚换来对方同等的惩罚,直到彼此之间有一方退出。通过谈判,再次回到合作的道路上。这中间既然惩罚无法达到目的,那就回到合作。彼此之间的合作永远是有可能的,惩罚的强弱决定着合作能否久远。

loy_20002000 发表于 2016-7-16 21:18:15

存在强力的第三方囚徒困境就不成立了。存在对彼此的惩罚机制同样不成立。只有损人可以利己并且没有其他条件的情况下囚徒困境才成立。

据说囚徒困境是纳什均衡的一个具体化例子,所以需要从博弈论入手。

rebos 发表于 2016-7-18 19:32:08

loy_20002000 发表于 2016-7-16 21:18 static/image/common/back.gif
存在强力的第三方囚徒困境就不成立了。存在对彼此的惩罚机制同样不成立。只有损人可以利己并且没有其他条件 ...

存在第三方或存在惩罚机制是走出或者是避免囚徒困境的两种方法,其实囚徒困境表明个人利益最大化未必是最优解,合作可能使两个人得到的更多。

loy_20002000 发表于 2016-7-19 23:55:53

rebos 发表于 2016-7-18 19:32 static/image/common/back.gif
存在第三方或存在惩罚机制是走出或者是避免囚徒困境的两种方法,其实囚徒困境表明个人利益最大化未必是最 ...

我引用一个他人的讲解,由于我不懂博弈论,仅仅是引用:最优策略可以是纳什均衡,但纳什均衡未必是最优策略。

博弈论一类与经济学一样,都是纯数学,与现实的对应关系不是很直接。我看的第一本经济学书籍是蒋中一的《数理经济学》,当时觉得是本十分糟糕的书,因为没有多少道理,倒是数学知识学到不少(18岁),现在回过头看是经典经济学教科书,事实与想象并不一致,这是看这类问题最困难的。囚徒困境与理发师悖论类似,从字面很难理解它讲的是什么。说一个我研究过的例子,哲学上怎么认为一个人是有知识的,有三点:1,命题是真的;2,这个人相信它;3,能证成它。表面看这是无法辩驳的,但有人给出反例并被研究了二十多年。光从字面的例子很难理解争论的是什么,内核是逻辑问题(参看台湾清华《哲学基本问题》公开课)。

rebos 发表于 2016-7-20 20:18:59

loy_20002000 发表于 2016-7-19 23:55 static/image/common/back.gif
我引用一个他人的讲解,由于我不懂博弈论,仅仅是引用:最优策略可以是纳什均衡,但纳什均衡未必是最优策 ...

博弈论应该是在研究经济学的时候,被提出来的。他们都有一个共同的前提,就是人的自利和理性。这个是和现实生活有些不同的,因为人不总是自利和理性的,而且理性和自利也是分开的,因为有的时候,会出现人自利了却不理性了。

总的来说,博弈论有一个好处就是把可能出现的结果都列出来,寻找可能性最大的那个结果,从而制定相应的策略。正如老兄引用的那句话一样,囚徒困境是一个纳什均衡,但纳什均衡却不是一个最优策略,反而合作是一个最优策略。但是要实现合作就需要信任或则就是威慑。信任不容易建立,威慑却比较好把握。

loy_20002000 发表于 2016-7-20 21:26:06

rebos 发表于 2016-7-20 20:18 static/image/common/back.gif
博弈论应该是在研究经济学的时候,被提出来的。他们都有一个共同的前提,就是人的自利和理性。这个是和现 ...

以字面说说我的浅见吧。

自利和理性是经济学研究的必要条件。我反思过心理学研究的现有方法:统计+模型,但在自我对话中(我的一种思考方式,就是以自我对抗的方式发现矛盾)发现除了工科方法外没有可靠的方法进行类似的研究。经济学也是类似,如果不做必要的假设,研究也就无从谈起了。哲学逻辑对蕴含这个概念做过很多研究与探讨,有相关的大部头著作专门探讨这个问题,条件严格不会出现逻辑错误,但适用范围有限,例如逻辑蕴含,几何中的推理用的是这类蕴含;条件宽松却会出现很多逻辑错误,例如实质蕴含,太阳昨天从西边出来所以奥巴马是女人是真蕴含,但这个推理是荒唐的。总之经济学没有找到有效的现实对应方式,因为严格就适用范围窄(数理经济学),宽松就得不出可靠唯一的结论(政治经济学)。

你说的两类解决办法不可行。以市场经济来说,第三方意味着不是由“看不见的手”在指挥经济,这是计划经济的特征。不管是凯恩斯主义还是供给主义学派都是通过政府介入或放宽的方式由“市场自主地调控经济”达到经济的最优配置。以我之见,二十世纪之后的经济学是对传统的修正,而不是背叛。

如果存在强势一方对弱势一方的惩罚,例如我是一个黑老大,我可以规定:你在做选择时只能选择我最优的。例如我交待,而你不能交待。权利上平等是资本主义社会的基本要求,不管事实上财富的天平如何扭曲,面子上必须做到个人的权利与财富不得侵犯。

rebos 发表于 2016-7-21 20:14:20

loy_20002000 发表于 2016-7-20 21:26 static/image/common/back.gif
以字面说说我的浅见吧。

自利和理性是经济学研究的必要条件。我反思过心理学研究的现有方法:统计+模型 ...

存在强势一方和弱势一方的时候,博弈就不是囚徒博弈了,这就成了大猪小猪博弈了。这个时候的小猪只能是跟随大猪做决策,这时的小猪是不自由的。互相惩罚是双方都有能力造成对等的伤害,这里的双方是平等的。互相惩罚是给双方一个比较可信的手段,这样通过威慑走向合作。

存在强势第三方,也是改变了囚徒博弈的环境,这时囚徒之间不存在博弈,他俩都是和强势第三方在博弈,这就转化到大猪小猪博弈了。这个就是权威的力量,小猪没有什么灵活性。

rebos 发表于 2016-7-21 20:15:27

边缘政策

这里的边缘指的是危险的边缘。边缘政策的核心在于制造一种危险,使博弈的一方畏惧危险而最终放弃。这里的难点在于危险的控制,对于博弈的双方来说,一个完全可控的危险,严格意义上说,它不是危险。因为在任何阶段都有方法把危险消除,这就降低了危险的可信度。为了增加可信度,这就需要给危险中加入一些不可控的因素。

这里需要说明,此时的危险依旧是可控的,但在局部上却出现了不可控因素。这就使博弈的另一方担心是否会出现意外,造成局部的危险冲突。这时才能促使博弈的双方对博弈的问题进行价值衡量。衡量价值低的一方就有可能选择推出,因为危险的持续放大,对于他来说不值得,而且会影响他在其它方向上的博弈。此时,危险依旧是可控的,这就给双方一个可以逐步推出的机会。所以,往往是感觉危险不可避免,博弈却被叫停了。

下面来说说核威慑。

边缘政策的终极应该就是核威慑,通过开启互毁模式来吓阻任何的全面冲突。对于博弈的双方来说,通过互毁就是最终的结局来促使双方再次回到谈判的道路上,从而从可能的方向上寻找合作的可能。如果不幸开启互毁模式,这对于双方来说是没有意义的,因为结局是都不存在,那博弈就成了多余的了。

总的来说,边缘政策仍是一个比较冒险的策略,因为危险的选取就是一个很难把握的问题,同时危险的逐步升级,会使博弈双方异常的兴奋,这都不利于双方博弈的发展。因此说,边缘政策是一门艺术,它玩得就是心跳。

niubuqun 发表于 2016-8-2 10:29:01

本帖最后由 niubuqun 于 2016-8-2 10:39 编辑

    说的不错,万物皆是信息。所有事物都可以建立模型,都可以被分析研究,这是大数据信息社会存在的基础。
     用广大人民群众的话说,这都是套路。

西溪老槐 发表于 2017-3-6 09:08:20

第三方的加入,就形成了“第三方”与“囚徒困境”在另一层面的博弈。

这个时候,囚徒在考虑与对方博弈的得失外,还得考虑这个结果与第三方博弈的结果。

如果不借助工具,一般人们是很难厘清这类镶套博弈的各种结果。现实中多为放弃。借助工具的结果,一般镶套三层后,单次博弈的结果可以有所谓最优优,而多次循环博弈的结果则表现出混沌性质。
页: [1]
查看完整版本: 囚徒困境