大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。
Jetbrains全系列IDE稳定放心使用
前几天看了个综艺《决胜21天》,主要是体现21种博弈论模型的游戏,非常有启发意义。
而且博弈论在商业领域、机器学习领域都会有应用,是职场中必须要了解和掌握的一门知识。
正好找到了一个有意思的入门点。先入个门,之后再深入系统的学习这个领域。
1、什么是博弈论问题?
2、怎么激活成功教程博弈论问题,让各方都达到利益最大化?
3、从这些博弈问题中抽象出来的博弈论模型 和激活成功教程之法。
1、博弈论的前提是你得承认人性是自私的,你不能够简单地通过“我们把大家都教好,大家都不要拿”就解决了。你需要设计一系列方案,一系列博弈手法,来让自私的人性相互制衡,最后达成一个对大家都有效的解决方案,这是值得一学的。
2、最有名的博弈论的命题,叫作囚徒困境。两个囚徒并没有余地去做那个对他们最有利的的选择,往往都是两个人争先恐后地交代,然后各判四年。这个就叫作囚徒困境。
3、纳什均衡的定义就是:在任何竞争或冲突中,如果各方不愿或者无法沟通,就至少会有一个纳什陷阱等着请君入瓮。双方均已选定一种策略,任意一方独自改变策略将会使情形恶化。假如这两个人是惯犯,在进去之前都已经商量好了,说如果抓住的话打死也不承认,这样的话咱俩都是轻刑。但是如果有任何一方改变事先约定,都会使得情形变得更糟糕,这时候他们就进入到纳什陷阱当中。
在各方都选择了同一策略的情形下,没有一方能够通过独自改变策略而获益,此时的策略搭配和后续结果,就构成了纳什均衡。
4、解决问题分两步:第一步是找到方式达成协议,我们要在这个博弈当中能够达成协议;第二步,找到方式让对方不变卦。比如说,一开始大家约定好都不招,这就是一个协议;但后来有人变卦,你就受不了了。所以要用博弈论的方法来解决这个问题。
5、让对方不变卦有三个途径:
(1)第一个途径叫作改变态度。就是我们在博弈的时候不要有那种 “不蒸馒头争口气”这样的想法,如果你能够稍微成熟一点,能够把效用范围变得更宽泛一点,可能更容易达成协议。
(2)第二个叫作诉诸善意的权威人士。我记得我很小的时候,家里边有人吵架,大家族里边这一家跟那一家吵架了,就会请两三个族中长老,围坐在一个大屋子里边开始讲理,跟今天的辩论会是一样的。其实我觉得我们家的民主氛围特别好,就是听老人家最后摆平,告诉大家应该怎么做。这个叫作诉诸善意的权威人士。
(3)第三个方法是制定能够自行运作的策略。就是设置一套能够自行运作的机制,不需要整天由长老出面来解决问题,这个是博弈论的重点。因为前两个其实都是教育工作,涉及的都是你的态度,你要信任。最后一个是不需要教育工作,你照着做就行了。
6、咱们的交通规则就是一套典型的自行运转的机制。很多地方不需要警察,只要有摄像头,交通就能顺畅地运行。所以重点就在于我们怎么样去打造出能够自行运作的策略来。
7、要解决囚徒困境,就要解决公平和正义的问题。作者给它起个名字叫作“我切你选”。人们对于公平和公正的需求,是一个底层的动物性的需求。
8、“我切你选”这样一个基本的管理方法,英文叫作mini-max(大中取小)。这个策略只有在零和博弈中有效。零和博弈就是这事咱们不会再创造更多的溢出效应,就是这么多,咱们怎么分吧。就比如说家里边分财产这种事,我不可能通过分财产这件事创造出更多价值来,要么我多,要么你多。这叫零和博弈。
9、这里边有三大难题。
(1)第一大难题是价值观不同,就是我切的时候,我们的价值观是不一样的,你可能喜欢奶油,而我喜欢蛋糕;或者你喜欢奶油当中有花的那部分,你觉得能够分到那朵花就够了,但是我不认为那个花很重要。这是价值观不同,不能够简单通过“一样大”就解决,生活就是这么复杂。
(2)第二个是实际执行的问题。蛋糕你可以拿刀切,更多的东西怎么切?比如荣誉感、署名、职称这些东西,就很麻烦。
(3)第三个难题是最后如何让这些人都接受这个结果。这三个就是我们想要保持公平公正最难的问题。
10、那如果遇到更复杂的情况,通过简单的“分蛋糕”不能解决了,应该怎么办呢?这里边有一个方法,叫作有争议的部分平分法。
什么叫作有争议的部分平分法?古老的智慧当中,犹太法典《塔木德》、中国过去的寓言中都有这样的故事:大房和二房要分财产,大房坚持认为说我要分全部的财产,这全是我的;二房认为说我至少应该分到这财产的一半。那么请问,根据我们古老的智慧,她俩应该各分多少?
答案是不用算,大房75%,二房25%。你说这是为什么?过程很简单,就是首先看哪些是有争议的部分。有争议的部分是一半,因为二房主张只要一半;另外一半是没争议的。没争议的先分给大房,剩下的一人一半,所以大房75%,二房25%。
11、基辛格说:你在谈判桌上能够获得多大的收益,取决于你一开始能够提出多么离谱的条件。就是你把那个争议的范围放大,最后你获得的东西会多一点。假如你像我们前面讲的那个二房,这么老实,说我就要一半,那你就只能获得这一半的一半了。
当然我不是想教大家变坏,不是让大家都变成那个特别野心爆棚的人。如果一个人总是用恶的策略对待别人的话,其实对他的博弈结果非常不利。
12、调整赢家法的基本原理就在于:对于同一项资产,不同的人可能会定出不同的价值,假如双方要划分所有权,就可以动些手脚,让双方感觉自己都拿到超过一半的所有权,达到双赢的局面。而且不管是什么情境都能够适用,这个叫调整赢家法,双赢。
这就叫调整赢家。我们俩被谁调整赢家了呢?被那个中介。中介给我做工作,说:完了,我告诉你,北京这房价都三万了,你放心吧,现在绝对是高点。被忽悠了,卖了。给买家调整的方法就是:这房子太便宜了,你赶紧买。所以我们俩最后抱着非常美好的心情达成协议交割了房子。现在那个房子大概十万块钱一平。
调整赢家这个策略在谈判过程当中肯定会有效,博弈的时候你要能够告诉大家说:这两块蛋糕虽然大小不一样,但是你这块上面有花呀,多开心,拿走。我们在对待小孩子的时候,经常会用这个调整赢家法,这是很有效的。
13、实在不行可以投票。就是大家说没法分了,投票吧。这也是一个公共决策的方法。这些东西都是为了解决囚徒困境当中不好分、没法达到公平的问题。
14、生活当中至少有七大困境,全是逻辑造成的。这是逻辑所带来的必然要面对的问题。
第一个叫作公地悲剧。公地悲剧是指多人的囚徒困境,所有人困在了那个最糟糕的状况之下。公有的地没人管,造成的结果就是所有人的效用都下降。
第二种叫搭便车,它其实是公地悲剧的变形。 搭便车的行为要想解决,最重要的就是,你要让搭便车的风险和代价提高,就是想办法去惩罚那些搭便车的行为。搭便车的行为之所以存在,是因为这个钱我不交也没影响,没有达到有效合作下限。在公司里边、小区里边、家庭里边、学校里边,经常会出现这种搭便车困境,所以我们需要提高它的代价,然后改变奖励结构。
第三个困境叫懦夫博弈。这个特有意思,懦夫博弈就是不退让的一方会获益的博弈。懦夫博弈就是看谁先服软,你往后退,行,你服软了,那我就过来,过来以后走掉,这个懦夫博弈才能够解决。能够解决的前提是你得往后退。
第一个办法,扩大一点你的效用范围。如果你的境界很低,你觉得只有优先通过这个胡同才叫赢,那么你就会发现谁也过不去;但是如果你有一点幽默感,你能够笑一笑,你会意识到说遇到了一个懦夫博弈,让开了,你会满足于自己的修养提高。
一旦你的效用范围扩大,解决问题的途径就变多了。“求仁而得仁,又何怨”。
第二个办法,你也得经常调换自己的策略,叫作鹰鸽搭配效果好。
如果你总是鹰派,你其实会伤害自己,因为对方知道跟你博弈没有好下场,他跟你杠上就是危机边缘;如果你总是鸽派,被大家琢磨透了,说这人总是骗人,虚架子,不管他,也没用。所以最好的方法是鹰鸽搭配。
第三个办法,在懦夫博弈当中,如果你对对方提出了威胁,有一个原则很重要,这个威胁要能够生效。如果不能生效,那就不是个威胁。
国际社会交往当中,我们说国际信用很重要。你如果没有信用,你想做出鹰的姿态,或者威胁别人的姿态,没人信。这都是我们在懦夫博弈当中要注意的东西。
第四个叫作志愿者困境。这个很有意思,简单地讲,就是第一个站出来的人肯定会牺牲,但是如果没有人站出来,所有人都牺牲。“双方互望,希望对方去做一件彼此都希望能完成,但自己又不想做的事”。
志愿者困境应该怎么样解决?谢林点:每个人在面对他人期待自己怎么回应的期待时,心中所产生的那个期望。我们有一些暗示、默契、心照不宣的地方。
打破志愿者困境的关键点,也是在于你的效用值跟别人不一样。如果每个人考虑的都是安危,那效用值一样,志愿者困境一定发生;但如果有人考虑高尚,如果有人考虑说这是我应该做的、我的价值观,那这时候,就比较容易打破志愿者困境。
第五个困境是两性战争。这特有意思,两性战争的前提是什么呢?就是两个选择都不错,都行,都能接受。不像志愿者困境或懦夫博弈那么要命,但是还是有差别,我就是不乐意。最要命的是春节回家去哪儿:去你家呢?还是去我家?你家已经去过几次了,为什么不能去我家?为什么咱们俩要一年去一个地方,咱们家就这么僵化吗?就算你想通过“今年你家,明年我家“来解决,也不行,吵架。这叫两性战争。
在解开僵局的过程当中,关键在于双方要同意以某种方式随机选择策略。由不具利害关系的第三方选择之后,私下告诉双方怎么做,但不要告诉他们这个策略对另一方有何影响。这个原则很简单,但实际执行起来还是会有点难,但是这已经是解决两性困境的最好方法了,因为引入了随机性,大家抛一下,就解决了。
球场上谁先开球,这就是两性困境。最后怎么解决的,抛硬币呀。裁判拿出个硬币一抛,解决了。所以引入随机性有时候真的能够很有效地解决很多问题。就像我们还是小孩子的时候,有些问题解决不了,石头剪刀布,大家卒瓦,一卒瓦就知道了。
七大困境的最后一个叫猎鹿问题。猎鹿问题的核心就是你要小心低风险的诱惑。因为猎鹿是一个高风险高收益的事,收益高,但你很有可能得不到。低风险会带来诱惑,就像抓兔子一样,但是这会使得别人很有可能抓不到那条鹿。这个就是典型的猎鹿问题。
这个“兔子”和“鹿”,在我们的生活当中是经常会出现的,那我们就要做抉择,就要去想:怎么样能够让大家更加相信这件事情。
15、说三个逻辑学家讨论一个问题的时候突然生气了。生气了以后怎么办呢?决定决斗。逻辑学家决斗就要有逻辑,所以他们就说,咱们拿枪出来决斗。决斗的方法是:枪法最差的人可以先开枪,这个人有1/3的命中概率;枪法第二差的人有1/2的命中概率,他第二个开枪;枪法最好的那个人,100%命中的,他最后一个开枪。这时候如果你是那个枪法最差的,有1/3命中概率的人,你该向谁开枪?你该先打那个枪法1/2准的,还是打那个最准的?
答案很简单,你只要对空放一枪。效用最大。为什么呢?你想想看,假如你砰打死了那个1/2准的,那你必死无疑了,因为剩下那个人一枪就给你打死了,你的死亡概率一下子变成了100%;假如你打死那个100%的,剩下那个人能打中50%,那你的死亡概率变成了50%。不论你打哪一个人,你最低的死亡概率都是50%。但是如果你对空鸣枪,把这个答案交给这个1/2的人来决定,1/2的人会打谁呢?1/2的人不管打谁,你的死亡概率都不会比50%更高,因为他既可能打那个100%的,也可能打你,就算他选择打你也只有50%,何况还可能会选择打他呢。
通过这个三方对决的模拟,你会发现,我们在多方博弈的过程当中,往往最有效的方法是让他人先博弈。你要能够学会退出来让他人先博弈,你会成为那个受益者,“螳螂捕蝉,黄雀在后”就是这个道理。所以多方博弈的时候,你有很多不同的选择,我们都免不了要跟别人 丁壳。
16、通过沟通协商来建立联盟,这才是解决博弈问题的最本质的东西。就是你发现如果我们真的相互信任,猎鹿问题也能解决,懦夫问题也能解决,志愿者困境也能解决。前提是真的信任,真的形成了联盟。
人类最朴素的沟通方法,或者说给我们带来了很多伤害的沟通方法,就是威胁和奖励。
最有效的方法是建立联盟。如果你能够和对方建立一个联盟,这些问题都能够得到解决。“有一个叫作罗杰·A.麦凯恩的人说,‘成功的可能就在于,原则上只要各方能够达成一个合作方案,任何非定和的博弈都能转换成双赢博弈。‘博弈论告诉我的确有法可循,只要建立起真正稳固的联盟即可。”
要建立起联盟,关键就在于信任。如果你能够产生信任,问题就得到了解决。
一旦有了信任,你就会发现这个联盟很容易建立。假如他们两个人不合作,两个人都要有巨大的损失。这就是在博弈当中引入第三方的好处,一旦第三方引入,联盟的关系发生了改变,问题就解决了,这个叫作通过协商来建立联盟的过程。
如果能够形成这样一个联盟,最终会达成的解决方案就叫作帕累托最优。帕累托最优就是最省力也最有效率的一种状态,处于帕累特最优当中的这几个博弈方,没有人有动力去改变目前的博弈结果,这就形成了一个短暂的帕累特最优。大家就都能够沿着这个方式,沿着一套规矩去做。当然如果外部的条件在发生改变、在引入新的博弈方,格局就会发生改变。
17、我生活当中的决策,很多是《思考,快与慢》的方式,丹尼尔·卡尼曼所研究的那个东西,心理学起到的作用比人的理性要多得多。在高级的博弈论当中一定要考虑到情绪的作用,而不仅仅是用囚徒困境那个简单的模型。
在博弈的时候,经常会有这种不蒸馒头争口气的状况发生,它不是一个简单的理性决策,所以博弈论会变得越来越复杂。
18、建立联盟的最大的困难就是信任。
从生理学上讲,信任的产生是来自于催产素,就是如果我们体内能够分泌很多催产素,我们更容易相信别人。你就了解说被别人爱的感觉会让你分泌催产素,而催产素会带来信任。甚至有人做过实验,在一种香薰里边加入催产素,喷在屋子当中;另外一个屋子里边没有。然后给他们做同样的实验,就发现喷了催产素这一组的屋子,更多人选择相信;而另外一组更多人选择怀疑。所以这种激素对人的作用是很大的。
19、不信任是风险导向策略,信任是报酬导向策略,不信任更接近于我们原始的本性。你在原始社会当中生活的时候,风险太大了,到处都是风险,所以你一天到晚都要保护自己。睡觉的时候都要枕戈待旦,都要拿着武器,就在于你是周围全被风险笼罩的。
但是如果一个人完全跟别人不合作,你也没法生存下去。信任是原始人类后天发展出来的东西,因为你要跟别人一块儿打老虎、一块儿打大象,必须得团队合作,所以后来出现了报酬导向机制。就是我信任了你,咱们团结,我们会获得收益。
但是这个风险导向的策略,也就是不信任,是我们体内最本质的东西。所以要想获得信任别人的能力,是一件不容易的事。
20、我们经常讲信任别人是一个能力,我也讲过一段话,有人觉得这话说得不对,但是我至今都觉得这话有它一定的道理,就是好多人都整天很紧张,怕被骗,但其实在我们的生活当中,被骗的成本和信任的成本比起来,哪个更高?其实被骗的成本是有限的,因为你被骗了,以后你就知道了,下次离开这个人,不愿意跟他再合作了。你就吃一次亏,认清了一个人,很划算。但如果你什么都不信任,这个人我也不信任、那个人我也不信任,这个团队我也不信任、老板我也不信任,你付出的成本可能是终身的。
信任是需要我们在后天慢慢培养起来的能力,如果你不把被骗当作是输赢来看待的话,其实它也就是一个学习的过程。
21、我们需要增加的不是防范别人的心理,防范别人的心理我们已经足够多了;我们需要学习的是这些案例。如果我们能够学会从这些案例当中找到经验,我们知道骗人就这么几种套路,你搞清楚了,然后你才能够比较明智地、开放地对待其他更多的人。
我们要变得更明智,不要放弃相信别人。有的人被人骗了一次以后的反应就是:我以后谁都不信,谁都不信的结果是你把自己封闭起来了,你没有了任何机会。而这个社会上其实好人是大多数,但你因为被骗了一次,一朝被蛇咬,十年怕井绳,放弃了对所有人的信任。完了,被骗一次成了终身的遗憾,他不但骗了你的钱,还毁了你的人生。这才是最要命的。
所以信任别人是一种非常重要的能力,前提是你要学习。
22、怎么才能够让博弈双方产生可信的承诺呢?两招。
第一招叫作反悔的代价极高。比如说,我们大家在一起二十年的朋友了,我们都是校友,都从一个学校里边出来的,我们共同认识的人至少有两百多个,这时候你骗我,成本高不高?你骗了我以后,虽然没有抵押,但是我只要把这个事说出来,你所有人脉关系全都没有了。这就是为什么在生活当中容易相信熟人的原因,他的成本代价更大。
还有使用一些边缘政策:你相信我绝对不会再让步了,因为我已经走到边缘。这就叫边缘政策,边缘政策能够给对方带来可信度。你比如说咱们看电影经常有这情节:有人发现了一个对方杀手的秘密,然后为了让对方杀手不杀他,就跟对方说,我已经把所有的影像上传了,如果我三天之内不更新那个密码的话,它就会被发到互联网上。这个叫作边缘政策,我就站在楼边上了,你说怎么办吧。你现在如果不按照我说的做,你把我“杀”了也没用,所有的资料全部发出去。边缘政策可以使得反悔的代价变高。
当然我们作为受孔子教育多年的人,我们不要走到那一步,人和人之间还是应该有基本的信任存在,这是美好的。但是处理很严肃的事情的时候,确实是需要这样。
第二招叫令对方无法改变心意,这两个其实有相似之处,怎么样令对方无法改变心意呢?比如说,破釜沉舟是怎么回事,就是打仗打到这儿了把锅砸了,把船全部沉掉。行了,士兵们都知道了,回不去了,今天不往前走,不把对方干掉,咱们全都得死在这儿。这叫破釜沉舟,使得我们无法改变心意也是取得信任的一个方法。
然后接下来的境界就比较高了,说假如你能够有慷慨之心和利他主义的话,这些就都不是问题了。慷慨和利他主义有时候能起到的作用要远远超过工于心计的博弈。
然后还有就是使用仪式,比如说古人喜欢歃血为盟,大家发誓。这是一种方法。还有就是直接信任,这效用很大。就是你先付出,你直接作出信任的表率。这招是我常用的,我经常在跟其他人的互动博弈、商业合作过程当中,先做出信任你的动作和举措。其实被骗的机会没那么多,我觉得还是蛮受用的哈。
最后论证来论证去,就发现:能够信任别人的人,愿意吃点亏的人,不那么斤斤计较的人,在博弈的过程当中往往能够获得一个更好的结果。当然,不是一味的傻。
23、“以直抱怨,以德报德”,我们不会主动地去做那个做坏事的人,背信弃义的人,我们会努力地做守信用的人。但是如果对方不守信用,我让他知道我是有能力反制你的,我也要做出相应的举措,逼着对方回到守信用的路径上来。这就是一报还一报策略,这个是经过数学计算和计算机的运转证明最有效的方法。
24、永远要原谅你的敌人,这样才能弄得他们真正难过。就是你的境界要比他高。
25、在这个过程当中,用一句话简单地来概括,博弈的有效方法就是不要心存嫉妒,不要想当第一个背叛的人。有恩报恩,有仇报仇,不要想耍小聪明,这就是合作的最有效方法。
26、最后强调一下:做好人最划算。就是你要始终做“以德报德,以直报怨”的这么一个人。人要学会做一个有底线、有操守的好人,这个才是我们博弈当中能够获得最高收益的方向。
27、最后作者总结了十大要诀,叫作个人扭转全局的十大要诀。就是如果你要想能够成为一个明智的博弈参与者,可以用这十个方法。都是我们刚刚讲过的,我们提炼一下。
第一个叫作赢就守,输就变。人不犯我我不犯人,人若犯我我必犯人,就是这个道理。
第二个,带入新的参与者。你俩搞不定,把你爸叫来,找一个第三方过来仲裁一下。引入第三方,除了引入更高的权威,还可以引入另外一个博弈者,他一进来博弈的局面就会改变。
第三个叫作建立互惠形式。就是你得相信你们的博弈不是一次性的,如果一个人认为他跟任何一个人的博弈都是一锤子买卖,都是最后一次的话,他不会做出明智的选择。中国有一句话讲得特别有智慧,叫“山水有相逢,大家走着瞧”,总有一天江湖再见。所以你给自己留一条后路,建立互惠的形式。
第四个叫作限制你自己的未来选项。让你一旦背叛这个承诺,就会遭受到损失,这就是我们前面讲的破釜沉舟的方法。
第五个叫付出你的信任。人心都是肉长的,你可以在江湖上建立信任别人的声誉,然后你可以建立一个江湖大哥的地位,让别人知道说你有包容度,而且你很重视自己的承诺。
第六个叫作定下特殊条件。双方如果想单方面背叛就会承受损失,像我们现在签的很多对赌协议,就是这样的方式。
第七个,使用补偿给付,来建立并维持合作的联盟。你补偿的可以是金钱,也可以是情感,也可以是尊重,等等。你要知道,人的效用值的范围是很大的,如果你能够找到更多的效用,你就能够引入更多谈判筹码。
第八个叫注意七大困境,考量各参与者的利益和成本,让困境不复存在。当然这不是那么容易的事啊,因为这跟随人类已经这么多年了。
第九个,分摊各种货品、责任、工作、惩罚,让人人都觉得结果公平。就是把共赢的错觉能够营造出来。
第十个,将团队化整为零。人太多,博弈方过多,博弈变得很复杂,很难摆得平。但是如果我们把它化整为零,变成一个一个的小团队,有时候就更容易产生更高的效率。这也是为什么现在很多组织喜欢做那种蜂窝状的结构,把组织都变成一个个的小组,战斗力变得很强的原因。
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/181757.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...