16727200000016

第16章博弈论的诡计(13)

第二批工人从中午12点开始工作，直到晚上6点，他们在6小时中付出的劳动为6；

第三批工人从下午2点开始工作，直到晚上6点，他们在4小时中付出的劳动为4。

很明显，他们所付出的劳动不是均等的。如果按照按劳分配的原则发放工资，那么第一批工人应该得到所有工资中的1/2，即10/(10+6+4)=1/2；而第二批工人应该得到所有工资中的3/10，即6/(10+6+4)=3/10；第三批工人的劳动量最少，所以他们应该得到所有工资中的1/5，即4/(10+6+4)=1/5。

但事实上农场主并不是这么分配的，他给了每一批工人1/3的工资，第三批工人比实际上要多拿了很多，所以他们高高兴兴地离开了；第二批工人虽然稍有亏损，但他们的劳动价值和工资水平基本持平，所以他们没表露出任何开心与不满；而第一批人工作量最大，却也只得1/3，所以他们感到很不满。

在最终的分配中，要注意客观公正：多劳多得，少劳少得，不劳不得。如果像这位糊涂的农场主一样，分配不均的话，一部分工人的积极性会严重受挫，如果以后再需要他们帮忙的话，他们可就不会这么用心地工作了。

所以，我们要提倡“按劳分配”的原则。想多得就多劳动，懒惰的人没有回报，这样无论结局怎样，谁都没理由抱怨。

约克和汤姆一起外出旅游。约克带了3块饼，而汤姆带了5块饼。半路上他们遇见了一个非常饥饿的行人，于是邀请他一起吃饭。他们三人很快将8块饼全部吃完了。吃完饭后，路人给他们8个金币，以感谢他们提供的午餐。约克和汤姆为这8个金币如何分配发生了争执。汤姆说：“我带有5块饼，应该我得5个金币，你得3个金币。”约克不赞同他的观点：“因为我们在一起吃了这8块饼，应该平分这8个金币。”即每人分4块金币。

因为一直没有令双方满意的答案，约克找到公正的夏普里。夏普里说：“孩子，汤姆给你3个金币，已经很不错了；如果你想要公正的话，你只能得到1个金币，而汤姆应该得到7个金币。”约克非常纳闷。

夏普里说：“你们3人一共吃了8块饼，你吃了其中的1/3，即8/3块，路人吃了你带的饼中的3-8/3=1/3；汤姆也吃了8/3，路人吃了他带的饼中的5-8/3=7/3。这样，路人所吃的8/3块饼中，有你的1/3，汤姆的7/3，所以，汤姆应该得到的是你的7倍。你认为有没有道理？”

在这个故事中，我们不难发现，夏普里所提出的“公平的”分法，遵循的原则是：应该得到的与所付出的相当。这就是夏普里值的内涵。

这个故事正说明了一个公平的原则：在分配的过程中，如果你付出得多，那么你将得到多的一份；如果你付出得少，那么你将得到少的一份。这种按劳分配的原则是目前比较合理的一种分配方法，所以很多企业单位都选择这样的分配方式。你创造的价值多，你的奖金就高；你创造的价值少，你的奖金就少。这样不仅合理地进行了分配，减少了资源的浪费，更可以调动员工的工作积极性，让他们为了自己的奖金而努力工作。

从猎鹿看集体优化

很久很久以前，人类还没有发明鞋子，都赤脚走路。一位国王到一个偏远的乡间狩猎，路面崎岖不平，刺得国王的脚酸痛。国王又气又恼，回到王宫后，下旨要将国内的所有道路都铺上牛皮。他认为这样做，不仅仅是为自己，更可以造福他的子民。然而这样做实在是劳民伤财，会给国家带来沉重的负担。但因为是金口玉言，大家只能摇头叹息。此时，一位聪明的仆人大胆向国王提出建议：“国王啊！为什么您非要劳师动众，牺牲那么多头牛，花费那么多金钱，劳累那么多民众呢？您何不只用两小片牛皮包住您的脚呢？这样，事情就变得简单多了。”国王听了非常惊讶，但马上明白了他的意思，于是立刻收回成命，改用这个建议。据说，这就是“皮鞋”的由来。

“将自己的双脚包起来”，改变原有的一些观念和作法，从某种角度上来说，这是一种对资源的合理利用。如果人们都听从国王的命令，杀掉全国所有的牛，并剥下牛皮铺路，那么请大家想一想，这会浪费多少的人力与物力呢？但如果只用两小片牛皮包住人的脚，走到哪里，牛皮就跟到哪里，这就相当于自己始终走在铺好的路上，而这样做的代价仅仅是两小片牛皮而已。这正是资源的优化配置。

在我们的生活中，有很多不合理的地方需要我们调整与优化，尤其是公共资源的非合理利用，所以我们迫切需要走集体优化的道路。

哈丁在《公地的悲剧》中设置了这样一个场景：一群牧民一同在一块公共草场放牧。当这块草地向牧民完全开放的时候，每一个牧民都想多养一头牛，因为多养一头牛增加的收入大于其成本，明显是有利可图的。尽管因为平均草量下降，每增加一头牛都会使整个草地的牛的单位收益下降，但对于每个牧民来说，增加一头牛总会使他有或多或少的利益可图，于是草场里出现了“牛满为患”的局面。而草场也会因为过度放牧，导致以后再也不能满足牛的需要，于是牛都饿死了。

如果每人都从自己私利出发，只看重眼前利益，盲目放牧不计后果，那么草场退化的代价还得由这些人来承担，于是“公地悲剧”就上演了。看似有利可图的牧民都为自己的错误选择付出了代价，导致了最终破产的结局。

哈丁在研究了污染、人口问题、过度捕捞、不可再生资源的消耗等问题后指出：“在共享公有物的社会中，每个人，也就是所有人都追求各自的最大利益，这就是悲剧所在。每个人都被锁定在一个迫使他在有限范围内无节制地增加牲畜的制度中，“毁灭”是所有人都奔向的目的地。因为在信奉公有物自由的社会当中，每个人均追求自己的最大利益。”

那么如何防止“公地悲剧”的上演，从而实现集体的优化呢？

哈丁建议，世界各国的人民都要意识到限制个人选择自由的必要性，接受“一致赞成的共同约束”。

首先，应该在制度与体制上建立相应的规则与监督体制，建立中心化的权力机构，并让它积极发挥出约束的作用，限制某些不合理的行为。

其次，要注重道德约束，道德约束与非中心化的奖惩联系在一起。

总之，要防止“公地悲剧”走上优化的道路，就不能任由众人为所欲为，合理的约束与限制有助于促进社会稳定高效地发展。

如果有两家石油公司在同一油田同时进行开采，两家公司都希望自己在开采中获得更多的利益，于是他们提高开采速度，并且选择了只采集优质原油，而放弃较差的那一部分。所以，在二者轰轰烈烈的开采过程中，看似都取得了很大的利益，可他们都违背了可持续发展的原则，造成了资源的严重浪费。当他们把这片油田开采完而再也找不到开采地的时候，他们会想：如果当时慢点开采，把所有的资源都合理地利用起来，提高开采质量，那么利益就会更高一些。

可见，博弈双方只有在达成协议、共同努力的情况下，才会实现资源的优化配置，最终走上集体优化的道路，也才能获得双赢，走出“囚徒困境”。

抓捕的困境

某个小镇上仅仅有一名警察，但他要负责整个镇的安全。现在可以假定，小镇的一头有一家歌舞厅，另一头有一家信用社。再假定该地也只有一个小偷，并且即将实施偷盗。因为没有分身术，警察只能在一个地方巡逻，而小偷也只能选择一个盗窃目标。假定信用社需要保护的财产价格为10万元，歌舞厅的财产价格为7万元。若警察在信用社巡逻，而小偷也选择了去信用社，定会被警察抓住；而如果小偷恰好去歌舞厅，则小偷偷盗成功。那么警察怎样巡逻才能使效果最有效呢？

如果让读者作决定，那么很大一部分人都会选择让警察去信用社巡逻。因为信用社需要保护的财产为10万元，歌舞厅是7万元，保证价值较高的一方利益不受损失。但如果小偷刚好去了歌舞厅，那么歌舞厅就会损失7万元，难道这个结果好吗？答案当然是否定的。警察应该做的是“保证”小偷作案失败。

警察的最优策略是抽签决定该去哪里；而小偷也不知道警察到底会去信用社还是会去歌舞厅，所以他的最优策略也是抽签。于是小偷与警察有1/4概率在信用社碰面，也有1/4概率在歌舞厅碰面。这样的博弈就又出现了“剪刀、石头、布”的类似情况，也就又牵扯进了随机选择之中。

此外，还有一个类似的案例。

警察可以加强巡逻的力度，或者选择休息。而小偷也可能采取作案、不作案两种选择。如果小偷知道警察选择休息，他的最佳选择就是趁机作案；否则，采取相反的措施。对于警察来说，如果他知道小偷要采取作案的行动，最佳选择是加强巡逻，否则最好去休息。当然，小偷和警察不可能完全知道对方将会采取什么样的行动，否则他们都会很容易正确估计出对方采取某种行动的概率，然后再决定自己要采取的行动。

我们再来分析一下这个例子，假定小偷在警察休息时一定作案成功，在警察巡逻时作案一定会被抓住，那么会有如下情况：

当警察巡逻，小偷不作案的时候，双方获益都是0；

当警察巡逻，而小偷作案的时候，警察获益为2，小偷获益为-2；

当警察不巡逻，而小偷不作案时，警察获益为2，小偷获益为0；

当警察不巡逻，而小偷作案时，警察获益为-1，小偷获益为1。

如果警察知道小偷以a的概率选择作案，那么不作案概率就为1-a，他该如何行动呢？

对警察而言，巡逻的预期效用为0(1-a)+2a=2a，休息的预期效用为2(1-a)-1a=2-3a。显然，当2a2-3a即a0.4时，警察最好巡逻；反之2a2-3a即a0.4的时候，可以休息。假设警察应以b的概率巡逻(休息的概率为1-b)，那么小偷作案的预期效用是-2b+1(1-b)=1-3b，不作案的预期效用为0b+0(1-b)=0。很明显，当1-3b0即b0.33时，他的明智选择是作案，反之最好待在家里。在这个博弈中，警察以0.33的概率巡逻，0.67的概率休息，小偷以0.4的概率作案，0.6的概率不作案，构成一个混合“纳什均衡”。

我们还可以这样理解上述混合“纳什均衡”。如果警察的概率巡逻高于0.33，小偷最好躲避起来。小偷一旦躲避，警察就会一无所获，自然会降低巡逻的概率，因此犯罪者重新开始行动，然后警察的警惕性得到提高，巡逻概率加大。从长远的角度来看，两者的均衡将维持在警察以0.33的概率巡逻，小偷以0.4的概率作案。现实生活中，我们可以观察到，当严打的时候(警察出击的概率较高)，犯罪分子便不敢张扬(作案概率降低)；严打一过，犯罪分子又开始恣意枉为，当罪犯过分猖狂时，警察将再次开始严打。

可以这样进行假设，假设一警局有100名警察，而犯罪集团有100名小偷。那么在上述博弈中，警察以0.33的概率巡逻，而犯罪者以0.4的概率作案，这一“纳什均衡”可以这样理解：在巡逻的警察低于33人时，犯罪集团最有可能派40名以上的小偷进行活动，在巡逻警察高于33人时，犯罪集团最好派40名以下的小偷作案；反过来也是一样。当然，也有可能出现这种情况，即犯罪集团倾巢出动，那么警察比较明智的选择也是全体出击，而警察一旦全部出动，小偷最好选择全部都不活动，警察最好全部休息……最后达到的均衡状态是警局派33名警察巡逻，犯罪集团派40个人作案。可以这样说，作案的小偷越多，那么出动的警察将会越多，作案的犯罪者越少，出动的警察也将越少；反过来道理也一样。

警察与小偷的博弈与随机策略和概率具有密切的联系。警、匪双方充当了零和博弈中的两个对立角色，双方都在为自己的职责和利益挖空心思地博弈，那么谁在其中占有更大的优势呢？其实，双方都不存在纯粹的占优策略。能不能碰面也是一个难以预测的问题。

打电话的博弈

相信大家都看过电影《向左走，向右走》。影片中两位住在隔壁的青年男女，由于生活习惯不同：一个习惯向左走，一个习惯向右走，结果尽管他们似乎充满了缘分，但是两个人始终无法面对面接触。在电影的最后，两个人在同一面墙的两边，思索着要给对方打电话。由于线路只有一条，他们怎样才能沟通成功呢？结果，由于两个人都不知道对方的意图，彼此都在拨打对方的电话，可想而知，只能是占线。

打电话也存在着一种博弈。在警察与小偷的博弈中，警匪双方为了战胜对方而采取混合策略。而在现实生活中，即使是双方计划合作，也常常会出现混合策略博弈。打电话的博弈就是一个明显的例子。

为了方便说明，我们把《向左走，向右走》中的片段进行一些改写。

小郑和芳芳是一对恋人，他们天天在一起，就连晚上各自回家后也要通话到半夜才肯休息。一天，两个人的电话又打到了半夜，忽然不知道什么原因电话忽然断了。此时两个人该怎么办呢？如果小郑马上回电话给芳芳，那么芳芳最好是在一旁等待，把电话的线路给空出来；如果芳芳也急着拨电话回去，就会出现双方均占线的情况。

很显然，小郑与芳芳在打电话这一博弈中，面临着是否应该回电话的难题。那么，如何处理这一问题呢？关键还是应该把自己的决策建立在对方的行动基础之上，如果对方会打电话回来，那你就应该静静地守在电话旁等待；如果对方在电话旁等待，那你就应该迅速地拨电话过去，但这都需要双方有一个预先的沟通。

如果在没有沟通的情况下双方会有这样的预期盈利：

如果小郑选择回电话，芳芳选择等电话，那他们的预期盈利都为1；

如果小郑选择回电话，芳芳也选择回电话，那他们的预期盈利都为0；

如果小郑选择等电话，芳芳选择回电话，那他们的预期盈利都为1；

如果小郑选择等电话，芳芳选择等电话，那他们的预期盈利都为0。

可见，回电话的博弈并不是“零和博弈”，双方要么均有利可图，要么都一无所获。那么这样的情况该如何应对呢？

一种方法就是原先打电话的一方继续打过去，接电话的一方依然继续等电话，这样就可能避免盲目地乱打。

另一种方法就是，如果一方电话费比另一方便宜，或者另一方接电话不收钱，那么比较合算的一方就主动拨电话给对方。

但这两种方法必须在双方有默契的情况下才可行，如果一方并不了解对方的心理，那还是干着急没办法。其实多数情况下都会出现双方“不知所措，盲目乱拨”的现象。于是，有人就会建议靠抽签或者是掷硬币的方法来决定如何做出选择。

假如小郑打算给芳芳打电话，有50%概率打通，也有50%概率发现对方正在通话中，因为这时芳芳也在给小郑打电话；如果小郑在等芳芳的电话，那么同样会有50%的概率接到电话，也有50%的概率等不到电话，因为，可能芳芳也在等。

第16章 博弈论的诡计(13)

第16章博弈论的诡计(13)