第二,气象预报受某些不确定的初始条件的约束。气象预报总是采用一种或然说的表达方式(“降雨概率为70%”),之所以采用这种方式,并不是因为天气本身存在随机性,而是因为气象学家认为他们对初始条件的测量不够精确。天气预测模型(由于符合混沌理论)对初始条件的变化极为敏感。同样的,在经济预测中,初始数据的质量通常都非常差。
然而,气象预报仍是本书中真正成功的预测例子之一。由于人与机器的通力合作、更好的数据收集方法和一如既往的辛勤工作,不论是飓风轨迹预测还是日间高温预测,都比一二十年前准确多了。
对于经济预测来说,还不能那么自信。对经济预测的任何幻想,都会被经济学家在金融危机之前所犯的重大错误打破。
如果气象学家也像经济学家一样遇到一些初始条件不明的动态系统问题,他们会用大量的自然科学知识来补救。像龙卷风这类天气现象,其物理属性和化学属性没有那么复杂,但这并不是说龙卷风很容易预测,而是对于龙卷风的形成和消散的原因,气象学家有着深刻的认识。
经济学更偏向于人文科学。尽管经济学家对于控制经济运行的基本体系有着相当正确的理解,然而,经济运行中各种情况的因果关系仍然模糊不清,在经济泡沫期和经济恐慌期时尤其如此,因为此时的经济系统中充斥着人为因素决定的反馈环。
尽管如此,如果对经济学家来说辨别因果关系很难的话,尝试一下总好过放弃。比如,再次仔细考虑一下哈祖斯在2007年11月15日写下的这番话:
抵押贷款可能造成的损失所引发的宏观经济风险要远远超出公认的水平……这种宏观经济的后果可能会相当戏剧化。如果负债经营的投资者看到贷款的总损失达到2 000亿美元,他们可能就会把借款相应地缩减2万亿美元。这是一个很大的打击……显而易见,这样的打击会引发严重的经济衰退,或是长期的经济萎靡。
哈祖斯还写道,因为房地产泡沫的影响,房价已经超出了消费者的购买能力,所以许多消费者用长期的大额贷款买了房,其中很多人已经停止还贷了,而这样很有可能造成极大的贷款损失。负债经营的程度会使问题复杂化,导致信贷市场和金融业出现更大面积的瘫痪。所以说,这样的打击足以引发严重的经济衰退。
这正是金融危机爆发的原因。哈祖斯的预测是正确的,他给出的理由也是合理的,不仅解释了金融危机爆发的起因,还预测出金融危机带来的影响。哈祖斯将这一因果关系链称作“故事”。这是一个与经济有关的故事,即使这个故事可能是一个数据导向的故事,但也是根植于真实世界的故事。
相反,如果你只把经济当作一系列变量和方程式,而没有看到其深层结构,那就很容易把噪声当成信号,误认为自己(还有那些轻信的投资者)正在做出准确的预测,而实际上你的预测并不准确。看看哈祖斯的竞争对手——美国经济周期研究所(ECRI)是怎么做的。
2011年9月,ECRI预测到近期可能会出现“双底衰退”(亦称“双谷衰退”),ECRI认为,“决策者无法阻止这次双底衰退。你认为这就是经济不景气吗?好戏还在后头呢”。在对ECRI总经理拉克什曼·阿楚坦的采访中,他认为经济衰退如果还未开始,那么马上就会开始了。对此说法,他们是这样解释的:
ECRI的经济衰退预测不是仅仅基于一两个领先指标,而是基于很多特定的领先指标,包括美国的长期领先指标、低迷期的周领先指标还有其他短期领先指标。实际上,那些最可靠、最让人期待的指标现在的集体表现,和完全衰退期的最高峰时的表现一样。
上面的解释包含了很多术语,可唯独缺乏切实的经济内容。ECRI的故事与数据有关(仿佛是数据本身引起了经济衰退),却与经济无关,他们似乎还引以为荣。在2004年出版的一本书中,他们这样建议客户:“你不必为了安全驾驶而去了解汽车引擎如何工作,同样,你也无须为了准确地阅读这些评估标准而去了解经济领域的庞杂繁复。”
进入大数据时代之后,这样的说法越来越常见。有了这么多信息,谁还需要理论呢?但在预测行业中持有这样的态度绝对是错误的,尤其是在数据如此杂乱的经济领域。有了理论支持,或者至少对其根源进行更加深入的研究之后,统计学推理就会变得更具说服力。比如,2011年9月,在欧洲出现债务危机时,对经济持悲观态度是合情合理的,但ECRI并不这么认为,它们拥有大量的随机变量,这些变量误把“相关性”当成了“因果关系”。
的确,ECRI的预测似乎标志着一个经济转折点,但却是朝着积极的方向转变。在ECRI发出经济衰退预测的5个月后,标准普尔公司的赢利率达到21%,同时,2011年第4季度GDP不但没有陷入衰退,反而实现了3%的平稳、健康增长。ECRI采取了缓兵之计,并“澄清”说它们的预测一直延伸到2012年,尽管这与它们最初的说法根本就不沾边儿。
经济预测中不可避免地会存在偏见
如果你想进行经济预测,最好的选择就是查看平均预测或群体预测,而不是求助于某个经济学家。我对“调查”的研究显示,群体预测总是比个体预测更准确,在预测GDP增长、失业率和通货膨胀这三个方面,群体预测比个体预测的准确率分别高出20%、10%和30%。通过研究许多领域的预测结果,人们发现几乎所有的群体预测都优于个体预测。
然而,虽说群体预测优于个体预测这一观念已成为重要的经验性规律,可是当预测与事实有很大的出入时,这一观念有时就会成为蹩脚的借口。群体预测是由个体预测组成的,如果个体预测的质量提高了,群体预测的质量也会提高。另外,在现实生活中,经济群体预测的质量也很差劲儿,所以还有很大的提升空间。
大多数经济学家作预测时,会在一定程度上依赖自己的判断,而不是依据统计模型输出的信息进行预测。考虑到数据是那么杂乱,这种做法或许是有益的。波士顿联储前副总裁斯蒂芬·K·麦克内斯曾经进行过一项研究,他发现根据统计学预测方法对人为的判断进行调整会使预测的准确率提高约15%。20世纪七八十年代计算机开始广泛使用时,人们普遍认为统计模型能够“解决”经济预测问题。但是,改进的技术无法掩盖对经济领域理论认识的缺乏,只会让经济学家更加快速、更加煞费苦心地将噪声误认为是信号。看似前景不错的预测模型在某些方面一败涂地,最后惨遭淘汰。在其他领域,比如那一时期的地震预测,也会遭遇这样的状况。
援引某个人为判断也会带来潜在的偏见。人们在进行预测时,会倾向于使预测满足自己的经济动机或政治信仰。人们或许太过自负,即使事实和环境要求他做出改变,他也不愿对自己的预测进行修正。哈祖斯告诉我:“我认为人们绝对有这样的倾向,急切地希望事情能按照自己希望的方式发展下去。”
是否有经济学家更擅长把握这种权衡的度?预测出上一次经济衰退的经济学家是不是也可以预测出下一次经济衰退?这个问题有一个非常有趣的答案。
用于评判预测技能的统计测试,在应用于“调查”时给出了否定的结果。也就是说,从这份调查中,人们似乎找不到证据证明某些经济学家总是比其他同行出色。然而,对另一个小组——“蓝筹经济调查报告”——的研究却总能给出肯定的结果。经济预测中显然少不了运气的成分,暴躁或是顽固的经济学家偶尔也会做出正确预测。但是对“蓝筹经济调查报告”的多项研究发现,长期来看,某些经济学家似乎确实要比其他同行略胜一筹。
这两份调查有什么不同呢?“专业预测人员情况调查”是匿名操作的:每位经济学家随机分配一个身份标识号码,他们在不同的调查中会一直使用这个号码,但是不会暴露自己的身份和职业。而在 “蓝筹预测调查报告”中,每个人的预测都标有其姓名和曾经获得的荣誉。
当预测结果标有自己的名字时,你的动机就会发生改变。比如,如果你在一家名不见经传的小公司工作,你的那些大胆预测就会备受重视,不管这个预测是准确的还是离谱的,你都会受人关注,这是合情合理的。而像高盛这样的大公司,为了能达成一致意见,预测反而会比较保守。
事实上,在“蓝筹经济调查报告”中,已经发现了这个特点:名气越小,作预测时就越不怕冒险。一项研究把这一现象称为“合理偏见”。即使知道这个预测十分冒险,你还是会为“大比分”放手一搏,这样做是可以理解的。反过来,如果你已经声名鹊起,即便自己手头的数据要求你做出大胆的预测,你可能也不愿意做出过于大胆的预测。
这两种对声誉的关注都有可能使你远离做出最诚实、最准确的预测这一目标,甚至还会使群体预测更加糟糕。整体来看,在对GDP增长率和失业率的预测上,“专业预测人员情况调查”的匿名参与者略优于参与“蓝筹经济调查”的那些名誉至上的受访者。
克服预测偏见的两种选择
如果说做出失败的预测是合乎情理的,那么这些预测肯定是在一些用户的纵容下做出的。正如一些政治专家以向党派支持者提供虚假消息为生一样,经济领域的投机者也因其特有的经济思想而拥有一定的市场。(有时,经济预测也有明确的政治意图,比如,从历史上看,不论是民主党还是共和党执政,白宫提供的经济预测通常都是最不准确的。)
然而,经济预测的风险要比政治预测高得多。正如罗伯特·卢卡斯所言,经济预测与经济政策之间的界限十分模糊,一个不准确的预测可能会使现实中的经济状况变得更加糟糕。
技术进步还是有望提高经济预测的准确度的。例如,谷歌的搜索流量就可以作为预测失业率这样的经济数据的领先指标。
在位于加利福尼亚芒廷维尤的谷歌总部,公司的首席经济学家哈尔·瓦里安对我说:“在我们看来,是否领取了失业保险中的最初赔偿,这一指标能够很准确地预测失业率,也能准确地预测经济活动。如果你在某一家公司上班,公司里即将裁员的谣言不胫而走,人们就会纷纷开始搜索‘失业人员救助办公室在哪里’、‘我该如何申请失业救助’等词条,从而更早地预测出申请失业救济的失业人数了。这算是一个领先指标。”
经济学和其他领域的预测历史显示,如果受到人类偏见的影响,技术进步也许就无法提高预测水平,而迄今为止鲜有迹象表明经济预测者已经克服了自身偏见,比方说,那些经历过“经济大衰退”的经济预测者似乎就没有刻意控制个人偏见。看看2011年11月“调查”对GDP增长做出的预测(图6–6),你就会发现其中显示出的过度自信倾向仍然和我们在2007年看到的一样,那些预测者对经济运行的上升和下行态势的预测都估计不足,按照他们预测的历史准确性来看,这次的预测错得有些离谱。
我们永远都无法彻底摆脱偏见,但是如果想减少这些偏见,我们有两个基本选择。一种是“供应性”选择,即为准确的经济预测创造市场。另一种是“需求性”选择,即减少对不准确且过度自信的预测的需求。
乔治梅森大学的经济学家罗宾·汉森是供应性选择的支持者。我曾经在弗吉尼亚北部的一家摩洛哥餐厅与汉森共进午餐,这是他最喜欢的地方之一。汉森刚过50岁,尽管头顶脱发严重,但是看上去很年轻,也有些古怪。他打算死后把自己的头冷冻保存起来。除了供应性选择之外,汉森还支持被他称为“法达奇政府”(一种在一定程度上受投机市场控制的理论上的政府形式)的系统,在该系统中,为政治决策拍板的是预测市场,而不是政治家。汉森显然并不惧怕挑战传统观点,他写过一篇题为“战胜偏见”的博文供读者思考,文化禁忌、思想观念或者错位动机,究竟是哪个因素限制了人们做出最佳决定的能力呢?
服务员端来我们的食物时,汉森对我说:“我认为最有趣的问题是,我们为预测付出的努力其实是多么微乎其微,即使对于那些我们认为十分重要的事情也是
一样。”
他继续说道:“在一个工商管理学硕士学院,你看到的管理者都是大决策者的形象或科学决策者的形象,他们每天忙于电子数据表和统计测试,权衡各种各样的选择。但是,现实中的管理人员所做的大多是管理团队和维持项目计划免遭终结等工作。如果他们组织各方协作完成一个项目,在最后时刻,预测结果突然变得起伏不定,而你却不能在最后关头放弃这一项目,不是吗?”
后来,汉森还说道:“即使是专业学者,对收集预测跟踪记录也没有多大兴趣——他们对做出准确的预测不感兴趣。还有一个更为基本的问题,那就是我们的社会需要专家,但不怎么需要准确的预测。”
为了解决这一缺陷,汉森一直力挺那些预测市场—可以让人们在某一特定的经济或政策结果上投下赌注的一些系统,如以色列是否会与伊朗交火,或是气候变化会导致全球气温升高多少。对于这些问题,汉森的观点十分明确:预测市场能够保证我们在作预测时获得实实在在的经济利益,而不仅是在同行面前“赚面子”。
在本书后面的内容中,我们会再次对预测市场进行讨论。预测市场其实不是什么“万灵药”,尤其是在我们误认为它们无所不能的时候更是如此。但是正如汉森所言,预测市场至少可以通过整理人们的动机来改善预测质量。
预测市场最基本的应用可能,就是对GDP增长率和失业率等宏观经济变量进行预测。我们有各种直接或间接的方法预测通货膨胀、利率和物价波动,但是对于GDP增长率,却还没有大的预测市场。
或许也有人会关注这样的预测市场:近年来,普通股与宏观经济风险之间的联系越来越密切,因此,可以找到降低二者潜在风险的办法。预测市场也可以为决策者提供实时信息,主要是不断更新的GDP增长率预测。人们对预测市场有了更多选择,如打赌GDP会增长5%还是下降2%,这对那些过度自信的预测者是一个不小的打击,而同时人们在预测经济时,也会得到更加可靠的关于不确定性的估值。
而另外一种解决方案——需求性选择要求我们必须成为更好的预测用户。在经济预测领域,这也许就意味着,我们应该把更多的目光投向像哈祖斯这样实实在在地探寻经济实质的人的身上,而不应关注那些将各种领先指标混在一起冒充预测专家的骗子;还可能意味着我们应该更加关注经济指标和经济预测中的噪声。与政治预测一样,GDP增长率的初始预测值在公布时也应该提到其误差幅度。
从更广义的角度来看,在预测中表现出的自信并不能代表预测的准确度,相反,这两者经常成反比。在经济领域或其他领域中,当我们阻止预测者对我们周围世界的内在风险给予百分之百的重视时,就会埋下巨大的风险。