参选人能否获胜在很大程度上是由他参与的竞选活动的类型决定的。竞选级别越低,民调的不稳定性就越大:美国众议院选举的民调就不如参议院的精确,参议院选举的民调就不如美国总统大选的精确。初选的民调结果与最终大选的民调结果更是相差甚远。2008年民主党初选期间平均票数丢了8个点,比预想的误差幅度大得多。2012年共和党初选时民调的情况更糟糕。实际上,在许多主要的州,如艾奥瓦、南卡罗来纳、佛罗里达、密歇根、华盛顿、科罗拉多、俄亥俄、亚拉巴马和密西西比,民调中处于领先地位的候选人往往一周后就会落败。
但到了临近大选那几天,民意调查就会越来越准确。表2–3展示了538预测模型对参议院选举结果进行预测后做出的简化图,该模型运用1998~2008年的数据,根据美国候选人领先民调的平均得票情况推断其获胜的概率。比如,某位参议院候选人在选举前一天领先5个点,且以往他选举获胜过,那么他此次获胜的预测概率高达95%,尽管新闻报道还会说这次竞选“难分伯仲”,但其实这次竞选他几乎已经胜券在握了。相反,如果是大选前一年领先5个点,那么他此次获胜的预测概率仅为59%,这个概率跟掷硬币作决定差不多。
表2–3?根据参议院候选人领先民调的平均得票情况预测其获胜的概率
领先情况
距大选日期 领先一个点 领先5个点 领先10个点 领先20个点
一天 64% 95% 99.7% 99.999%
一周 60% 89% 98% 99.97%
一个月 57% 81% 95% 99.7%
三个月 55% 72% 87% 98%
六个月 53% 66% 79% 93%
一年 52% 59% 67% 81%
这样,538网站的预测模型的价值就显现出来了。有了它,人们就可以非常轻松地对大选进行预测,观察一个候选人是否在全部或者大部分民调中都处于领先位置,判断他是否会成为最终获选的幸运儿(除了少数例外情况,这一假设还是正确的)。预测候选人获胜的准确概率其实更难。我们的大脑处于高度探测模式,一直都在寻找信号,但同时我们也应该对得到的数据的干扰程度进行甄别。
对于这种思考方式我已经习以为常了,因为我的专业背景主要包括两大学科:体育运动和牌类游戏。浸淫在这两个领域中,你会明白什么叫见惯不怪。牌类游戏玩多了,你会轻而易举地抓到“皇家同花顺”,久而久之,当你的对手抓到一手“同花”牌时,你的牌可能已经满堂红了。体育运动,尤其是棒球,其中也有很多出现概率很低的事件最终实实在在地发生了。2011年,波士顿红袜队当时有99.7%的机会成功打入季后赛,可还是铩羽而归。对此我很无奈,只能说,一般的概率法则对红袜队和芝加哥小熊队不起作用。
然而,政客和政治观察员对这种不确定性却深感不满。2010年,一个民主党的国会议员在美国总统大选前几周给我打来电话。他代表西海岸一个民主党占绝对优势的地区,但是考虑到共和党当年的良好表现,他还是很担心会丢掉自己的位置。他想知道的是,我们的预测会有多大的不确定性。我们为他提供了一个估值:民主党的获胜概率无限接近100%。但近似100%指的是99%、99.99%还是99.999 9%呢?如果他落选的概率只有十万分之一,他就应该把自己的竞选基金捐赠给民主党优势不够明显的地区的候选人。但现在一切都不确定,他连1%的风险也不愿意冒。
同时,不同政治派别还会对你预测中的不确定性进行曲解。他们认为你是在两面下注,你在为可能出现的预测失误找借口。实际上不是这样的。如果你预测某位现任国会议员获选的可能性为90%,你同时也是在预测他有10%的可能性落选。一个出色的预测的标志是,每一个概率最终都会被事实证实是正确的。
泰特罗克所定义的刺猬型专家对概率的理解尤其差劲。当你说某个事件有90%的概率会发生时,这句话本身拥有非常具体且客观的意思,但我们的大脑却会把这种说法转变为比较主观的推测。心理学家丹尼尔·卡尼曼和阿莫斯·特沃斯基给出的事例表明,这些主观推测通常并非总是与客观事实相吻合的。一架飞机安全着陆的概率是90%、99%或者是99.999 9%,我们看不出这3个数字有多大差别,但是在考虑应该订哪个航班的机票时,这3个概率对我们而言立即有了天壤之别。
多加练习,我们的预测就会变得更准确。泰特罗克所定义的那些刺猬型专家与其他人的不同之处在于,他们很固执,不愿意从自己的错误中吸取教训。想让他们承认自己对这个真实世界的预测存在不确定性,就相当于让他们承认自己对这个世界发展趋势的论断存在不足,这是所有理论家最不情愿做的事情。
原则二:今天的预测是你以后人生的第一个预测
另一个误解是:一个成功的预测不会改变。当然,如果你的预测结果每天都会出现巨大的波动,那可能就是一个不好的预示——不是设计的模型很差劲儿,就是你的预测对象根本不具备可预测性。2012年,在各州公布共和党初选的预测结果之前,我抢在他们之前发布了自己的预测结果。我只是根据民调结果进行预测,这些概率经常会随着民调结果的变化而变化。
若结果的可预测性更强——比如美国总统大选到了竞选后期——预测结果通常会更加稳定。2008年美国总统大选之后,我听到来自民主党最多的评论就是,他们向538网站求助以稳定党内人心。到了总统竞选后期,各个州每天会发布近三四十份民调结果,其中一些不可避免地会出现很大的偏差。那些喜欢把竞选气氛变紧张的候选人、战略家和电视评论员可能会把重点放在局外人的民意调查上,但是538网站的预测模型发现,这些民调不会对大选结果产生太大影响。
最根本的是,不管你上周、上个月还是去年说了什么,“今天做出最好的预测”才是应有的态度。做出新的预测并不意味着旧的预测不复存在了(最好对整个预测过程做个记录,并请人对你的预测效果进行评价)。但是,如果确定昨天的预测是错误的,那就没必要坚持了。经济学家约翰·梅纳德·凯恩斯有一句著名的论断:“当实际情况发生改变时,我的想法也会随之改变,你是怎么做的呢?”
有些人不认同这种进程–修正分析的方式,误认为那是软弱的表现。改变想法似乎是在欺骗自己——无异于伸出手指去测量风向。批评家通常含蓄或明确地认为,政治与物理、生物等学科类似,本身就应当遵循可知性和可预测性等基本法则。(我接触最多的批评家中有一位是普林斯顿大学的神经科学教授。)这样看来,新信息就不那么重要了,各种竞选就像冲向地球的彗星一样,应当沿着可预测的轨道行进。
然而,选举预测与物理和生物不同,倒是有点接近扑克牌游戏:我们可以观察对手的行为,从中找到一些蛛丝马迹,但是我们看不到他的牌。更新、更好的信息会不断出现,所以,只有时刻更新预测才能最大限度地利用有限的信息。因为害怕出丑而不对预测进行更改,这其实才是懦弱的表现。
原则三:寻求共识
每个刺猬型专家都幻想着自己能做出大胆、无畏又与众不同的预测——对一个话题的看法一定要跟众人的意见迥然不同才行。刺猬型专家遭受同事的排挤,就连家里的金毛猎犬也认为他们有些滑稽。但很快,结果证明他们做出的预测完全正确、绝对正确、不容置疑地正确。两天后,他们上了《华尔街日报》的头版,同时附有一张照片,他们坐在杰伊·雷诺的沙发上,个个都像大胆而勇敢的先驱。
这样的预测可能偶尔是正确的。专家的共识也可能会出错——如果当初某个专家预测到苏联解体,那他一定会受到此生最大的褒奖。然而,幻想的情节终归难以成真。狐狸型专家——包括我本人在内——虽说不是墨守成规的人,但当我们的预测与竞争对手的大不相同时,我们总会感到忧虑。
许多证据表明,群体预测要比个人预测准确,其准确率随预测领域的不同通常会高出15%~20%。这并不是说群体预测就一定是准确的(我们会在本书稍后的部分对这个主题进行深入探讨),但从多个角度考虑问题总会大有裨益。
泰特罗克曾经对我说:“狐狸型专家通常会独立思考问题,而刺猬型专家则习惯与别人共同商讨问题。”他的意思是,狐狸型专家已经培养出一种仿效集体决策过程的能力。他们不再咨询整个专家组,而是不停地向自己发问。通常这就意味着他们需要将很多不同类型的信息集合起来——就像一组各持己见的人真正要做的那样——他们会客观地对待所有信息,而绝不会把某一条信息当成金科玉律。(以538网站的预测为例,这些预测通常会把民调数据和经济、各州人口统计等有关信息综合起来)。那些没有留心泰特罗克指导意见的预测者,总要为此付出代价。
2000年美国总统大选前夕,经济学家道格拉斯·希布斯公布了一个预测模型,声称依据经济增长和战争伤亡率这两个变量,就可以非常准确地预测出总统大选的结果。希布斯提出了一些十分大胆的刺猬式主张,他认为依据总统的支持率(通常这是总统能否连任的可靠信号),根本不会提高预测的准确性,对通货膨胀率和失业率有所了解同样也不会提高预测的准确性。候选人的身份无关紧要:一个政党既会推荐乔治·麦戈文那种有着强烈党派意识的议员,也会推选德怀特·D·艾森豪威尔那样的中间派战争英雄。希布斯断言,关键的因素是一个相对模糊的经济变量,即被命名为“实际可支配的人均收入”。
那么,希布斯的预测模型究竟得出了什么结果呢?它预测戈尔会获得压倒性胜利,并且说他最终会以9%的优势取胜,但在佛罗里达州重新计票之后,获胜的却是小布什。戈尔确实赢得了美国普选,可这个预测模型表明,美国总统大选结果和预测结果会有天壤之别,且出现预测结果的概率只有1/80。