书城经济一本书读懂大数据
21532200000026

第26章 我们离不开的数据生活(2)

在医疗方面,数据提供的见解会不断变化发展。这些见解都是基于当时的最佳数据。正如试图通过模式识别出诈骗的诈骗检测系统在基于更多数据时能配备更好的算法并实现系统优化一样,当我们掌握了更多的数据后,对于不同的医疗情况会有不同的推荐方案。

对男性来说,致死的癌症主要是肺癌、前列腺癌、肝癌以及大肠癌,而对于女性来说,致死的癌症主要是肺癌、乳腺癌和大肠癌。抽烟是引起肺癌的首要原因。1946年抽烟人数占美国人口的45%,1993年降至25%,到了2010年降至19.3%。但是,肺癌患者的5年生存率仅为15%,且这一数字已经维持40年未变。尽管1971年时任总统的理查德·尼克松宣布要全民抗癌,但目前仍没有癌症防治的通用方法。很大原因在于癌症并不止一种:目前已发现200多种不同种类的癌症。

美国国家癌症研究所隶属于美国国立卫生研究院,每年用于癌症研究的预算约为50亿美元。癌症研究所取得的最重大进展就是开发了一些测试,可以检测出某些癌症,比如2004年开发的预测结肠癌的简单血液测试。其他进展包括将癌症和某些特定病因联系在一起。比如1954年一项研究首次表明吸烟和肺癌有很大关联,1955年的一项研究则表明男性荷尔蒙****素会促生前列腺癌,而女性雌激素会促生乳腺癌。当然,更大的进展还是在癌症治疗方法上。比如,发现了树突状细胞,这是提取癌症疫苗的基础;还发现了血管,就是肿瘤通过生成一个血管网,为自己带来生长所需的氧气的过程。

最近,大数据发挥了更大的作用。举个例子,美国国家癌症研究所研制的“细胞矿工”是一个基于网络的工具,它为研究人员提供了大量的基因公式和化学复合物数据。这样的技术让癌症研究变得高效。过去,处理这些数据集意味着要处理运作不便的数据库,因而,分析和汇聚数据也就异常艰难。从历史角度来看,想用数据来解答疑问和可以接触到这些数据的人不重叠且有很大代沟。而如“细胞矿工”一样的科技正是缩小这一代沟的工具。研究者们用“细胞矿工”的前身,即一个名为“对比”的程序来确认一种具备抗癌性的药物,事实证明,它确实有助于治疗一些淋巴瘤。而现在,研究者们使用“细胞矿工”弄清生物标记,以了解治疗方法有望对哪些患者起作用。

智能时代让生活更健康

大数据不仅通过改变我们的生活方式提升了我们的身体健康状况和幸福感,它也在改变我们的生活环境。据世界银行提供的消息,智能城市有望构建更好的机制,促进城市发展。它们的目的在于“提高收集、分析和引导数据的能力,从而通过加大科技利用来帮助市政部门制定更优决策”。而谈及“城市数据”时,联合国人居中心的克里斯托弗·威廉姆斯说道:“关于城市数据,我们今天所处的水平和20世纪30年代的数据水平持平。”

如今,世界上超过一半的人口居住在城市里,到2050年这一数字会增长到3/4。收集城市数据的一大挑战在于将收集到的数据标准化。不同城市有各式各样的数据收集方式,收集到的数据类型也不统一,这就加大了比较不同城市间的数据以发展最佳做法的难度。但是可以收集到相关数据的城市,能够在基建设施的投资方面做出更好的决策。如果考虑到这类投资可能的持续时长,这样的决策就很重要。

智能能量计等设备已经能测量能源消耗,并告知用户能量使用详情。在旧金山等城市,智能停车表可以汇报街道上是否还有停车位,而司机通过简单易用的手机应用程序就能获得这些数据。这些智能停车表上搭载来自PayByPhone的产品,它能让人们通过手机拨号或者使用移动应用来支付停车费。如今,该公司推出的产品约有300万用户。

舒文波是一个公司白领,他很喜欢使用手机完成各种事情。

他的手机记录下了各种数据。这个月,舒文波一共打了8个电话,平均每次通话12分钟,根据手机显示,最后一次电话他打了19分28秒。前天晚上,他搭乘地铁去往图书馆,路上一共花了1小时11分,他手机上的秒表记录了这个数字。这一周,他一共晨跑5.5万米,一个运动记录软件告诉他,这个记录超过了90%的朋友。而手机上的多看阅读告诉他,他一共读了210本书,超过了98%的用户。一款可以使用摄像头测试心跳次数的软件告诉他,他的心跳次数为64次/分钟。他刚刚在微信上玩了一把“打飞机”游戏,游戏结果告诉他,他在所有好友中排在第二位。

以上是舒文波的手机记录下的各种数据。一个小小的设备,居然能够记下如此之多的数据,这在20年前是完全无法想象的事情。同样的事情在世界每个角落发生着,怀孕的准妈妈使用一款记录胎动次数的软件记录着胎动,一位老人使用一款倒计时软件提醒自己按时吃药,一位少女使用一个便签软件记录下自己每天体重的变化……这些场景在生活中随处可见,我们已经见怪不怪。

很多中国人都在以数字记录着自己的日常生活,而美国人在这一方面做得更多一些。最近的一项调查研究显示,平均每10个美国人中就有7个人按时记录自己的身体数据,用来记录身体数据的设备则多种多样,比如大脑、纸笔、电脑、平板电脑、手机,等等。这项调查里,大约有3000人承认,他们记录最多的数据项是体重和饮食。另外有1/3的人则记录身体内部的各项数字——从血压到睡眠到血糖。美国消费电子协会数据显示,2012年美国健康市场是一块价值700亿美元的蛋糕。预计2018年以前,每一年都会有4.85亿可穿戴设备面向市场出售。而“关注人的可穿戴科技”公司Jawbone的估值已达10亿美元,或者可能更多。

大数据时代,人们越来越习惯用数字来量化各种事情。在各类传感器开始大量出现的今天,我们也越来越习惯用数字记录自己的健康数据。

2013年6月,百度联合咕咚网推出一款名为“咕咚手环”智能可穿戴式设备。咕咚手环支持运动提醒,还可通过记录睡眠在最理想的时刻将佩戴者唤醒。用户可将该手环穿戴在手腕上,24小时监测每天活动量及睡眠情况,并能根据使用者睡眠深浅状态,在应该叫醒的时间段中的浅睡状态下通过震动来唤醒佩戴者。这个手环是首款基于百度云开发的便携式设备,它能与百度云结合,用户可以把运动手环中所记录的数据实时汇总到百度云端,随时记录查看。咕咚网与百度云的合作还将进一步深入,蓝牙体重秤、蓝牙自行车码表等一系列手机智能配件将会陆续推出。

咕咚手环就是一个很典型的使用传感器量化健康的设备,目前这类设备还不够普及,但在未来,这类设备将占据我们生活很重要的一部分,从咕咚网和百度云的合作就能够看出。

量化身体数据指的不仅仅是那些糖尿病人每天测量血糖以控制病情,更是一种普通人的生活方式。我们正在成为我们自己身体的科学家。一些数字的忠实信徒不仅记录自己吃的每一口食物、走的每一步路,还将数据上传云端,与他人分享。如果说以往人们还是把自己的人生放进一个堆满照片的小盒子里的话,如今我们的人生已经散布在网络世界和电子设备里了。

不仅是健康方面,连家庭关系也开始被量化。一位美国女演员受到一本书的启发,决定将她和她丈夫的关系进行量化。她把婚姻比喻成一个夫妻双方共同管理的银行账户,而将促进关系发展的行为视为存款,导致关系紧张的行为视为取款。量化就这么进行了下去:如果丈夫说了什么不好的话,她可以从丈夫的账户里取走30%,而如果她因为什么不高兴的事情和丈夫打起来,丈夫则有权取走她户头上的所有积蓄;反之,如果谁精心准备了一顿晚餐等,则可以获得额外存款。她坚持记录了好多个月,觉得受益匪浅。她自嘲地说自己其实是一个不怎么有条理的人,却迷恋让一切结构化的想法。她和她丈夫都自称“自我量化者”,并参与到量化自我的运动中。

“量化自我”一词来源于《连线》杂志主编凯文·凯利和加里·沃尔夫,他们在2008年提出这个概念,用来借指那些不断探索自我身体以求能更健康地生活的人们。5年后,成千上万的量化自我运动的坚实拥护者开始在整个美国范围内组织聚会,还有数百万涉足量化自我的参与者也加入其中。不只是那些将血糖数据从血糖控制器传送到智能手表上的糖尿病人,也不只是通过测量来控制每天摄入的黄油量的人,更多的是那些更有力地控制自我的人,他们每天记录自己做了多少个俯卧撑、每天上班路上的时间有多长、跑步或者骑车锻炼的频率有多高,等等。还有一部分喜欢宠物的人,则试图记录他们宠物的日常数据。也有人将之用在婴儿的身体数据监控中,比如检测婴儿的体温还有活动。当然,也有不少浪漫的自我量化者,比如那些每天为孩子拍一张照片以记录他们长高数据的父母。这些以各种方式量化自我的人,共同组成了一个“大数据生活模式”。

一定要追溯的话,量化自我其实很早就有了,比如写日记记录下当天的天气和自己的心情就是一种量化自我的表现,而要像今天一样大规模地形成运动,则完全依靠科技的帮助。在今天,各种传感器大量出现、迅速普及,人们才大量成为自我量化者。

其实当今世界几十亿的人群,每天通过手机产生的地理位置、视频、照片、声音等信息都算是量化世界中的一部分。自我量化者自然也是在为大数据作贡献。大数据与大小无关,它指的是如何用数据来产出新的东西。我们正在随时随地收集我们自己的呼吸以及心率数据——这是从前只有大的调查研究室才能做到的,而如今这样的数据正在爆发。