这些模型还需要借助大量的数据。模型需要准确的人口统计资料,通过人口普查就可以获得相当准确的相关资料。另外,这些模型还需要解释人类行为,而这项任务则要难以预料得多。例如,一位26岁的拉蒂纳(意大利地名)单亲妈妈接种疫苗的可能性到底有多大?你可以设计一份调查问卷来询问她——基于Agent建模方法都十分依赖调查问卷的数据。但是在被问到健康选择时,受访者常会撒谎(或是记不清自己的选择):比如,受访者宣称的洗手次数比实际次数要多,避孕套的实际使用情况也是如此。
格雷芬斯特博士告诉我,有一条原则相当深入人心,那就是人们接受并参与那些有些麻烦但有益健康的做法的意愿,与他们对患病风险的感知紧密相关。我们模拟的匹兹堡人只有在她认为这次H1N1流感十分严重时,才会去接种疫苗;若她觉得流感的情况不严重,她是不会去接种疫苗的。可是,如果她的邻居或是她的孩子生病了,她对流感的感知会发生怎样的变化?如果当地的新闻中充斥着流感的报道,她的反应又会怎样?因此,基于Agent建模方法与疾病预测中自我实现和自我否定的特性息息相关,因为它们是动态变化的,同时也允许这些仿真个体的行为随时间变化,在处理这些问题时,这些模型用起来也许更加得心应手。
另外,可以看看多姆博士和他在芝加哥大学的团队,他们正在建立基于Agent的模型,用来研究一种名为MRSA(即耐药葡萄球菌)的危险病毒的传播,这种病毒会使普通的创伤,如切伤、刮伤、擦伤等演变为威胁生命,甚至无法治愈的传染病。MRSA病毒的结构十分复杂,有很多传播途径:可以通过拥抱这类非常随意的接触传播,可以通过暴露的伤口传播,也可以通过汗液或血液这样的体液接触传播。有时这种病毒还会停留在很多物体的表面,如案台或毛巾。另外,运动员的更衣室也是孕育MRSA病毒的温床,在那里运动员常共用运动器材;已经报道的MRSA疫情有很多病例就发生在橄榄球队中,从美国高中橄榄球队到美国职业橄榄球联盟都有发生。但许多携带MRSA病毒的人并没有发病,也没有表现出任何病症,这便使情况变得更加复杂。
在为MRSA病毒建模时,多姆和他的同事必须问自己一些问题,比方说:哪一类人被割伤后会用邦迪创可贴?不同的文化背景下,拥抱行为是否普遍存在?一个社区中有多少人坐过牢(监狱中潜藏着葡萄状病毒)?
对于这类问题,传统模型根本无法解答,而基于Agent建模至少使做出较为准确预测成为可能。但是,匹兹堡和芝加哥团队需要考虑的变量数量大、范围广——当你竭力对整个人群中每个人的行为进行模拟时,必然会是这样的情形。这两个团队的工作常常要借用认知心理学、行为经济学、人种学乃至人类学的知识:基于Agent建模用于研究HIV在社区中的传播,而这些社区就如同巴布亚新几内亚的丛林般各具特色,又如同阿姆斯特丹的同性恋酒吧一样风格迥异。要了解这些社区,需要对当地的习俗和环境等知识了如指掌。
因此,基于Agent建模对研究者的要求颇高,奋斗在这一领域的团队通常都是多学科交互的全明星队,团队成员都是各自研究领域的精英。但由于缺少数据,这些精英常常劳而无功。“就连H1N1病毒,我们都很难收集到有关何人、何时、何地患病的具体地理数据。”格雷芬斯特哀叹,“可想而知,要想获得过去爆发的所有疾病的数据有多困难。”
与匹兹堡和芝加哥这两个团队进行交流时,他们的话有时会让我想到一些关于中国的故事,这些故事你和我都读过,讲的是中国某些购物中心极尽装饰的情况——罗马圆柱、室内过山车,威尼斯运河,无一不有——但购物中心却没有店铺营业,也没有人逛。芝加哥和匹兹堡的团队都已经得出了一些十分有用且可行的结论——例如,匹兹堡大学的格雷芬斯特博士想到,过于草率、频繁地让学校停课(以防止疾病传染),有可能会事与愿违;而芝加哥大学的团队猜测到,芝加哥内城的MRSA病例数量不正常,这个问题是由进出库克县监狱的人群引起的。但是,这些模型模拟的情况至少都在几年之后才有可能出现,他们正翘首期盼着眼下那些根本不存在的数据。
基于Agent建模——不像气象预报的模型可以依据每日的数据进行修正——也很难检验。重大疫情只是偶尔来袭。即使这些模型是对的,但由于成功的疾病预测存在自我否定的特性,这些模型也有可能会成为自身成功的受害者。假设该模型暗示某项特殊的干预措施——如让学校停课——可能会十分有效,而这项干预措施也确实奏效了,现实中该疾病的传播速度就会降低。但回头想想,这样的结果可能会使该模型之前的预测看似过于悲观了。
因此,匹兹堡和芝加哥团队一直在犹豫是否将他们的模型应用到具体的预测中。其他团队在2009年H1N1流感爆发前则没有这么谨慎,其中一些团队发布的相关预测十分糟糕,严重地低估了H1N1病毒的传播范围。
目前,这些团队的活动大多局限于多姆的同事奇普·马卡尔所说的“为见解建模”。也就是说,基于Agent建模可以帮助我们进行了解传染病的实验,但目前这些模型还不能帮助我们预测疾病的爆发。
预测是为了让损失最小化
美国最近两次流感恐慌证明了,天花乱坠的宣传是不可靠的。1976年,只有迪克斯堡爆发了甲型H1N1疫情,其他地区基本没有疫情;当时的美国总统福特推行的“全民接种疫苗计划”纯属过激反应。2009年,相当数量的人感染了H1N1流感病毒,但是病亡的病例却很少。这两个例子说明,美国政府关于疫情严重程度的预测实在有些离谱。
但谁都不能保证,下一次流感疫情爆发时,会不会出现同样的预测错误。虽然人类逐渐适应禽流感,但禽流感病毒H5N1仍会使数千万人丧生。若一种流感病毒的传播速度和2009年H1N1病毒的传播速度一样快,致死率又和1918年西班牙流感的致死率一样高,就会使140万名美国人丧生。还有其他一些威胁来自非流感病毒,如传染性非典型肺炎(SARS)病毒,甚至来自天花,虽然早在1977年全球就已经消灭了天花,但这种疾病极有可能被恐怖分子制成生化武器,再次引入社会,谋杀数百万人。根据定义,最严重的流行病传播的速度极快:2009年,H1N1病毒只用了大约一周时间就从医学界毫无察觉的病毒发展成一种让数百万人丧生的病毒。
我为本章写作所采访的那些流行病专家强烈地意识到自身所用模型的局限性,这一点和其他领域的专家形成鲜明对比。哈佛大学的马克·利普思奇告诉我:“依据3个数据点作预测是很愚蠢的。”利普思奇所说的“3个点”是指1918年、1957年和1968年3次流感的爆发,“我们能做的就是为病情发展的不同状况作好准备”。
如果你无法做出准确预测,却假装自己可以确保预测准确,这样做通常会贻害无穷。我猜想流行病专家和医学界的其他专家深知这一点,因为他们必须遵从希波克拉底誓言:最重要的是,不能伤害别人。
医学界对统计模型的使用最为谨慎,医生总能恰如其分地扮演预测的角色。这并不是说经济学家或地震学家作预测时没有风险。但由于医学直接与生命和死亡挂钩,医生会更加谨慎小心。在医学领域,错误的模型会让人丧命。后果很严重。
另外,奇普·马卡尔关于“为见解建模”的概念还要进一步充实。本书的主导思想是,预测既是手段也是目标。比如,预测在验证假说时发挥核心作用,因此在所有科学领域都发挥核心作用。
正如统计学家乔治·E·P·博克斯所写:“所有的模型都是错误的,但是其中有些是有用的。”这句话的意思就是,所有模型都是这个世界的简化形式,因为这是必要的。正如另一位数学家所说:“一只猫最好的模型就是一只猫。” 其他模型都会遗漏一些细节。这些细节是否关系重大,取决于我们试图解决的问题究竟是什么,还要看我们想要得到的答案有多精确。
在我们使用的工具中,统计模型并非唯一一个要求我们做出粗略估算的工具。例如,语言就是一种模型,一种我们用于相互沟通的近似值。所有语言都包含一些单词,在别的语言中却没有直接对应的同源词,即使两个词都在尽量解释同一个事物,它们也不是同源词。技术领域有其特有的语言。
但是,博克斯写道,一些模型是有用的。据我观察,芝加哥和匹兹堡两支团队正在进行的基于Agent建模就十分有用。这些模型能断定不同族群对疫苗的态度,能推出疾病在一个城市中不同社区的传播情况,也能猜到人们对流感新闻的反应,这些本身就是重要的问题。
一个好的模型即使失败了也有价值。“我们应当假设无论作什么预测,通常都是错误的。”欧祖诺夫告诉我,“所以,通常作预测就是为了了解错误是如何形成的,出错时该怎么做,如何将损失最小化。”
关键是要记住,模型是帮助我们理解某一领域复杂性的工具,而不是取代整个领域。这一点不仅在作预测时十分重要。一些神经学家,如麻省理工学院的托马斯·波焦认为人脑处理信息的方式就是通过一系列近似值获得的。
这就是为什么在预测时,形成更好的自我认识,正确解读所收到的信号如此重要。本书的前半部分主要介绍这些近似值在哪些领域服务于我们,又在哪些领域使我们惨败。本书的后半部分则关于如何更好地提高近似值,每次只提高一点。